从信息公开说@@起@@
 
  上世纪中期@@,美国政府@@的会议记录@@,包括国会议员们的讨论记录@@,只要不涉及国家安全@@、个人隐私@@,都会在网上公开@@。人们可以通过@@每位议员的发言@@,进行政策分析@@。这是早期信息公开的体现@@。
 
  2009年@@,金融@@危机之时@@,美国也在救市@@,通过@@Recovery.gov上的地图@@,人们可以看到各地公共财政资金的流向@@,点进去可以看到每笔政府@@资金的地点@@、数目@@、签约方@@,以及钱是怎么花掉的@@。从整个美国地图看@@,投入最多的是加州和纽约州@@。这些也属于信息公开@@。
 
  环保领域有个项目叫@@“AirNow”。从这个@@网站@@,人们可以看到全美的空气质量@@。图例从绿色@@@@、黄色到红色代表从优到差@@。点进去可以看到纽约州@@,进一步点击@@,可看到某一区域@@、某市的空气质量@@。
 
  上海@@环保局空气质量检测中心在@@2010年@@世博会时也推出了@@此类平台@@@@。
 
  在公共服务方面@@,上海@@还有@@“上海@@公厕指南@@”这个@@软件@@,通过@@公厕的位置定位@@,你可以像使用大众点评找饭店一样@@找周边的厕所@@。点开软件@@,你可以了@@解厕所的基本情况@@,有几个蹲位@@,有没有纸@@,等等@@。
 
  但以上所有这些@@,都不是开放政府@@@@数据@@@@@@,而@@是属于政府@@信息公开@@。
 
  开放政府@@@@数据@@@@
 
  奥巴马@@2009年@@宣布就职时@@,签署了@@一个关于开放政府@@@@的备忘录@@。到了@@@@2010年@@,美国开放政府@@@@指令进一步明确提到了@@@@数据@@层@@,确定了@@相关要求@@,其中包括@@:政府@@机构推出开放数据@@@@网页@@;要求落实到一个具体的联络人@@,而@@非只有联系方式@@;减少@@《信息自由法@@》积压的工作@@;发布更多@@数据@@库@@。之后@@,美国推出了@@世界上首个国家级的开放政府@@@@数据@@@@平台@@@@data.gov。
 
  目前@@,美国联邦政府@@已在此平台@@开放了@@来自多个领域的@@13万个数据@@集@@。这些领域包括农业@@、商业@@、气候@@、生态@@、教育@@、能源@@、金融@@、卫生@@、科研等十多个主题@@。
 
  一些国家政府@@之间合作@@,发起了@@@@OGP(开放政府@@@@合作组织@@),目前@@已有@@70多个国家参与这个@@合作伙伴组织@@,其中一项工作就是开放数据@@@@@@。
 
  不过@@,开放政府@@@@不完全等同开放数据@@@@@@。开放政府@@@@的要求包括@@,官员财产是公开的@@,财政类数据@@是公开的@@。大数据@@@@时代到来@@,引出了@@开放数据@@@@的概念@@@@。但开放数据@@@@也不完全等同于开放政府@@@@数据@@@@@@,开放数据@@@@还包括其他数据@@@@,如开放科学数据@@@@、商业@@数据@@等@@。
 
  开放政府@@@@、大数据@@@@、开放数据@@@@这些概念汇到一起@@,就引出了@@开放政府@@@@数据@@@@的概念@@@@。
 
  刚才我讲过@@,我一开始举的那些例子@@,更多@@属于政府@@信息公开@@,政府@@信息公开与开放政府@@@@数据@@@@不完全是一回事@@。
 
  第一@@个差别是@@,政府@@信息公开更多@@是在信息层面@@,开放的是一些文件@@、已进行过加工处理的数据@@@@,而@@非原始的数据@@集@@。
 
  最底层的数据@@是原始的@@、还没有被赋予意义的@@。对数据@@进行加工分析@@,发现了@@一些意义@@,找到了@@@@一些规律@@,就成了@@信息@@。而@@当信息能指导决策时@@,就变成@@了@@知识@@,这些知识能告诉你应该怎么办@@。
 
  而@@开放政府@@@@数据@@@@意味着@@,只要不侵犯国家安全@@、隐私和商业@@机密@@@@,人们可以对数据@@进行利用@@@@@@、再利用@@@@,不同的人可以分析出不同的结果@@。
 
  第二个差别是@@,政府@@信息公开与开放政府@@@@数据@@@@的目的不同@@。政府@@信息公开的主要目的@@,是保障公众的知情@@权@@。因为政府@@拿纳税人的钱@@,应该让公众知情@@@@、公众参与@@、公众监督@@,更多@@地是政治和行政上的责任@@。公开了@@信息之后@@@@,公众知情@@了@@@@,政府@@的工作也就完成了@@@@。
 
  而@@开放数据@@@@不仅要让人@@“知情@@”,更要让别人@@“利用@@”这些数据@@@@,尤其是再利用@@@@@@,让社会@@根据自己的需求来使用数据@@@@,更多@@是出于经济和社会@@发展的考虑@@。
 
  政府@@在履行行政职能过程中@@,采集和储存了@@大量数据@@@@。这些数据@@@@同公众的生产@@、生活以及城市方方面面息息相关@@。需要挖掘大数据@@@@@@,发现规律@@,以此做出基于数据@@驱动的@@、更好的决策@@。政府@@有责任将这些数据@@@@开放@@给社会@@@@,让其再利用@@@@@@,产生更大的社会@@价值@@、经济价值@@、公共价值@@。所以@@,开放政府@@@@数据@@@@本身没有意义@@,只有当社会@@利用@@这些数据@@@@时@@,才有意义@@。
 
  这张图从左到右@@,是知情@@权和利用@@权@@;从上到下@@,是数据@@层到信息层@@。开放是信息层@@,主要是为了@@知情@@@@。在政府@@网站@@上发布数据@@@@,仍然只是为了@@让你知道@@,你能查询相关数据@@@@,但不能下载和利用@@@@。
 
  而@@政府@@开放数据@@@@@@是在利用@@层@@。政府@@信息资源再利用@@@@@@,虽然也强@@调利用@@@@,但还是有限度@@,是在授权范围内给特定对象的@@,可能信任谁@@、和谁关系好就把数据@@给谁@@,而@@非公平地开放给全社会@@@@。
 
  开放数据@@@@意味着@@,大家有平等@@的权利@@,可以对数据@@进行利用@@@@,而@@不是给了@@@@B不给@@A。不是要因为靠拥有资源获得竞争力@@,而@@是鼓励企业将资源开发利用@@得更好@@,拼创意和服务@@,而@@不是拼谁和政府@@关系好@@。[page]
  政府@@开放数据@@@@@@的基本原则@@
 
  到底什么样的数据@@符合政府@@开放性数据@@的原则@@?
 
  1、这些数据@@@@是完整的@@:除非涉及国家安全@@、商业@@机密@@、个人隐私@@的数据@@@@,理论上要求所有的政府@@数据@@都要开放@@,开放是原则@@,不开放是例外@@;
 
  2、这些数据@@@@是一手的@@:不是整合或@@者修改过的数据@@@@;尽量保证一手性@@;
 
  3、这些数据@@@@是及时的@@:必须以最快的数据@@更新和发布数据@@@@,将过时的数据@@对外发布@@,会使数据@@的价值大打折扣@@;
 
  4、这些数据@@@@是可获取的@@:有一个开放@@、可公开获取@@(数据@@)的平台@@@@;
 
  5、这些数据@@@@是可机读的@@:不是简单在政府@@网站@@上开放@@pdf或@@word格式的数据@@@@,而@@是要开放@@API接口@@,让需要数据@@的企业用机读的方式下载和利用@@这些数据@@@@@@,使这些数据@@@@直接和企业和第三方的应用@@打通@@。政府@@每次@@更新数据@@@@,企业和三方提供的应用@@就能即时更新@@。
 
  6、非歧视性的@@:政府@@要公平地将这些数据@@@@开放@@给全社会@@@@,数据@@一旦开放@@,就要对社会@@平等@@开放@@;
 
  7、非私人所有的@@:任何使用这些数据@@@@的机构和个人不能排除其他人使用这些数据@@@@的权利@@,这些数据@@@@不为任何私人所有@@,而@@是公共产品@@;
 
  8、这些数据@@@@无需授权使用@@:除非涉及到国家安全@@、商业@@机密@@、个人隐私@@的数据@@@@,所有人无需获得政府@@授权或@@很容易地获得授权后便可在政府@@开设的平台@@@@上下载和利用@@这些数据@@@@@@;
 
  政府@@为什么要开放数据@@@@@@,价值何在@@?
 
  大数据@@@@有多重来源@@@@:政府@@、社会@@、其他组织@@。有这样@@的研究@@,在一个国家或@@社会@@共同体中@@,最核心的数据@@@@70%—80%掌握在政府@@手中@@。所以@@,大数据@@@@是建立在开放数据@@@@的基础上的@@,由政府@@开放出来让公众利用@@@@。
 
  开放数据@@@@不是政府@@归拢数据@@@@,只由政府@@利用@@@@,进行开发决策@@。如果是后者@@,那这不是大数据@@@@@@,而@@是从@@big data变成@@big brother——后者意味着@@,我们在政府@@面前没有任何隐私@@。
 
  真正全社会@@的大数据@@@@@@,是政府@@开放数据@@@@@@@@(在不涉及国家安全商业@@机密@@和个人隐私@@的前提下@@),让全社会@@充分利用@@@@,做到大众创新@@,万众创业@@。
 
  国外这些开放数据@@@@平台@@@@,如之前提到的美国的@@data.gov ,不仅开放数据@@@@集@@,还提供链接@@,展现和推广社会@@基于政府@@数据@@@@开发的创新应用@@,鼓励大家利用@@数据@@@@。
 
  那么@@,基于政府@@数据@@@@,到底可以产生怎样的结果@@?2012年@@,纽约市@@“艾琳@@”台风@@,许多非政府@@救援组织使用政府@@公布的@@“飓风疏散区域数据@@@@”来制作地图@@,引导市民疏散应急@@。这些疏散区域的数据@@早在一年@@之前就向公众开放@@,艾琳@@台风@@到来之时@@,基于这些数据@@@@开发的各种应用起了@@很大作用@@。
 
  大家可能要问@@,为什么不是纽约市@@政府@@门户网站发挥作用呢@@?事实上@@,当时纽约市@@政府@@门户网站因巨大访问量面临瘫痪@@,同时@@ ,政府@@也难以基于不同地区@@、不同特色@@、不同人群的需求做开发@@。实际上@@,在把握用户体验和市场方向方面@@,商业@@机构@@、社会@@组织等会比政府@@网站@@做得更好一些@@。
 
  比如@@,气候@@公司@@(Climate Corporation)需要制作保单来弥补联邦农作物保险和因气候@@造成的农民损失之间的差额@@,会通过@@庞大的传感器网络来分析和预测@@2000万英亩美国农田的气温@@、降水@@、土壤湿度和产量@@,在知晓高温天的天数以及土壤湿度数据@@之后@@@@,建立模型帮助保险公司预判农民需要的天气保险金额以及公司需要的保费等@@。政府@@开放气象数据@@@@@@,气象数据@@@@导入系统就会计算出更精准的农作物收成保单上的保费@@。
 
  还有一个应用是@@“别在这里吃@@!”。政府@@已经发现了@@一些餐馆的风险@@,要对其查封@@。但老百姓并不知道@@。以前@@,政府@@在网站上发布清单@@,但公众在大街上吃饭时@@,能记住是哪家餐馆吗@@?难道还会上食品监督管理局的网站上查找吗@@?
 
  纽约在开放数据@@@@之后@@@@,就有公司基于数据@@开发@@“Don't Eat At”,只要你带着装这个@@@@APP的手机走到上了@@黑名单的饭店门口@@,这个@@APP就会向你发送警示信息@@,提醒这家餐馆有严重问题@@,正在调查@@。很多饭店并不怕政府@@罚款@@,反正吃客不知道@@,交完罚款后继续做生意@@,而@@“别在这里吃@@”这样@@的应用@@@@,要的就是这种效果@@:让吃客来淘汰犯错的饭店@@,而@@不是靠政府@@罚款@@,饭店犯一次@@错@@,成本就无法承受@@,让良币驱逐劣币@@。
 
  另一个应用是@@“Superheros”(城市中的超级英雄@@)。当我们需要时@@,拨打@@120,120接到电话后@@,救护车才呼啸而@@来抢救@@,这是呼叫中心模式@@。这当中有中间体@@:打电话@@,由呼叫中心调配救护车@@。而@@在等待救护车的时间内@@,你不知道楼上就住着一位医生@@,会简单急救和人工呼吸@@。
 
  针对这种情况@@,有人做了@@@@“Superheroes”。一方面将就近的公共卫生@@和医疗急救的设施和位置开放出来@@,另一方面@@受过基本医疗训练的人也可以在上面注册@@。当求救者按这个@@红键@@,不仅向@@120发布信息@@,还向周边发布求救信号@@。或@@许@@,附近百米之内@@,就有人能来帮助你@@,离你最近的医院@@,能直接收到急救信号@@,可以不必通过@@调度@@,更快地进行急救@@。也就是说@@@@,政府@@开放数据@@@@@@,民众也可以登录注册来贡献自己的数据@@@@,这个@@平台@@将这些数据@@@@汇集起来@@,提供急救服务@@。
 
  还有一个关于消防栓的案例@@。在美国东北部地区@@,冬天雪量很大@@,导致消防栓被埋@@,影响消防部门救援@@。之前的一种做法是@@,政府@@自己派人去维护消防栓@@。而@@后@@,有人开发了@@一个@@“领养@@消防栓@@”的应用@@。这不是政府@@主导的@@,而@@是市场基于政府@@开放的消防栓位置的数据@@开发的@@。
 
  这个@@计划号召小朋友们领养@@消防栓@@@@,只要你把这个@@消防栓挖出来@@,这个@@消防栓就属于你@@。但如果你没有照顾好这个@@消防栓@@,被雪埋了@@@@,然后又被别人挖了@@出来@@,那么@@消防栓就归别人@@“领养@@”了@@。跟@@“偷菜@@”一样@@,孩纸们甚至半夜都会爬起来去挖消防栓@@,这就是发动公众参与@@@@,因此消防局不用再派遣人手去巡查消防栓了@@@@。
 
  纽约大学实验室做了@@一个排名@@“open data 500强@@”(开放数据@@@@500强@@),对那些基于政府@@开放数据@@@@@@形成的创业公司进行排名@@,鼓励大家利用@@政府@@数据@@进行创新@@。美国政府@@开放数据@@@@@@后@@,已形成了@@一个产业@@:对政府@@数据@@进行加工@@、创新和利用@@@@。过去一些由政府@@自己来做事的模式@@,变成@@了@@政府@@开放数据@@@@@@@@、让社会@@参与利用@@的模式@@。
 
  这个@@过程中@@,社会@@不是来给政府@@找麻烦的@@,而@@是来帮忙的@@。如果数据@@是大米@@,那么@@将数据@@开放@@@@,将由民众决定是做粥@@、白米饭@@、煲仔饭还是米粉@@。政府@@让民众自己去做@@,而@@不必自己做@@。
 
  过去的模式@@,是政府@@开发应用@@。其中的问题@@在于@@,一是要花钱@@,二是政府@@做出来的应用@@@@,对用户体验@@、市场需求的把握能超过市场吗@@?更坏的结果是@@,生米煮成熟饭@@,政府@@做得很辛苦@@,社会@@还不领情@@,吃力不讨好@@。
 
  社会@@已经越来越个性化@@,政府@@自己开发的服务已不可能满足这么多个性化需求@@,这也是开放数据@@@@兴起的一个原因@@。
 
  经济模式的转型不能只依靠传统制造业@@,而@@是基于创新@@、创造@@、创意产业@@。一旦数据@@开放@@出去@@,会围绕它形成新的产业和服务@@,来促进经济增长@@、大众创业@@、万众创新@@。
 
  其实@@,政府@@不必给企业丰厚的创业补助@@、政策帮扶@@,而@@是应该开放数据@@@@@@,推动企业创新@@,社会@@发展和服务提升@@,“智慧城市@@”的新思路由此而@@生@@,智慧城市@@不应只是自上而@@下的规划和政府@@主导的建设@@,而@@应由大众参与@@。让城市变成@@一个创新空间@@@@,人人参与@@、人人贡献@@,共同运用自己的智慧建设城市@@。
 
  现在他们@@最缺少的核心资源是数据@@@@。最好的模式@@,是让城市成为活的机体@@,每个人都以共创@@、协同的方式@@,参与创建这个@@城市@@。政府@@的责任由自己做@@,变成@@培育和维护这个@@生态@@圈@@。实际上@@,政府@@仍在主导地位@@,但主导的方式不同@@,不再是一切都靠自己来做@@。
 
  中国政府@@开放数据@@@@@@现状@@
 
  开放数据@@@@不是看数量@@,关键是看它的价值@@。相比国外@@,中国开放数据@@@@总体还很少@@,现有的开放性数据@@价值并不高@@。
 
  开放数据@@@@有国家层面和地方层面@@,但更重要的还是在地方层面@@。国家层面的数据@@更宏观@@,城市层面的数据@@更接近应用人群@@,对市民更有意义@@。国外是先开放国家层面的数据@@@@,现在则强@@调要推广到城市层面@@,而@@中国是反过来@@,这倒是我国开放数据@@@@的一个特色@@。
 
  根据开放政府@@@@数据@@@@实践的成熟度@@、相关资讯完善度@@、行政层级和地域的多样性@@,我们选择了@@一些政府@@开放数据@@@@@@门户网站样本来研究@@,包括北京@@、上海@@、武汉@@、无锡@@、湛江@@、宁波市海曙区@@、佛山市南海区@@。
 
  我们研究了@@哪些内容呢@@?一是看平台@@层@@。目前@@,各地方平台@@都包含三大模块@@:数据@@导引@@、数据@@获取@@、互动交流@@。其存在的问题@@包括@@,普遍交互便捷性差@@;缺乏高质量数据@@应用展示@@;沟通交流缺乏便捷性@@、有效性@@、公开性@@。
 
  二是看数据@@层@@,主要存在如下问题@@:开放数据@@@@总量偏低@@,可机读的数据@@比例不高@@,大多为静态数据@@@@,不是动态的@@;数据@@按承诺更新比例低@@,当时上线时@@,政府@@承诺每月更新@@,但实际上@@很久才更新@@;整体都未严格符合开放授权的要求@@。
 
  三是看基础层@@。中国地方政府@@开放数据@@@@@@@@,已从特大型城市扩展到不同地域@@、不同规模的地方@@;开放数据@@@@的地方相对集中于沿海一二线地区@@,经济通常较发达@@,政府@@信息化基础相对较好@@,IT产业具备一定潜力@@。但是@@,这些地方针对开放数据@@@@的专门政策和工作方案普遍缺位@@,管理体制大多不足以支撑工作推进@@,领导力支持尚不足@@。
 
  对此@@,我们的建议包括@@:加强@@管理架构和体制机制@@建设@@,制定相关政策与工作计划@@;提高领导重视程度和支持力度@@;要基于社会@@需求@@,开放高价值数据@@@@,展现数据@@应用@@;提升数据@@开放@@性与可机读比例@@;规范数据@@更新周期@@,落实数据@@更新@@;完善数据@@授权协议@@;降低数据@@获取@@与互动门槛@@。[page]
  开放政府@@@@数据@@@@的难点@@
 
  中国开放数据@@@@的现状令人并不满意@@,难点主要集中在以下几方面@@:
 
  第一@@,对政府@@来说@@@@,第一@@个问题是@@,数据@@在哪里@@?有一些政府@@部门自身信息化的能力@@,并没有达到公众期望的水平@@,他们@@自己确实没有采集相关数据@@@@。但很多情况下@@,其实@@是政府@@部门不知自己有这些数据@@@@@@,因为这些数据@@@@不在这个@@部门@@——政府@@内部有很多部门@@,别的部门采集过的数据@@@@,这个@@部门不一定知道@@,也没有梳理过一个完整的数据@@目录清单@@。于是@@,政府@@对自己有什么数据@@资源并不清楚@@。
 
  第二个问题是@@,需要考虑这些数据@@@@能不能开放@@,是否涉及国家安全@@、商业@@机密@@、个人隐私@@。如果涉及上述内容@@,这些数据@@@@就不能开放@@,因为会对社会@@造成危害@@,但要搞清楚是否涉及国家安全@@@@、商业@@机密@@、个人隐私@@,这并非一个简单的工作@@,法律法规有时比较模糊@@,甚至相互存在冲突@@。
 
  第三个问题是@@,愿意不愿意开放@@?这些数据@@@@现在在部门手里@@,是有利可图的@@,部门拥有这些数据@@@@资源@@,相对其他部门和社会@@上的企业来说@@@@,就有很多优势@@,大家都想要数据@@@@。数据@@免费开放之后@@@@,部门利益可能会受到有形无形的损失@@,甚至部门地位会下降@@,这样@@有些部门就不愿意开放数据@@@@了@@@@。
 
  第四个问题是@@,这些数据@@@@的质量有问题@@,数据@@质量@@并不好@@,不全面@@,不及时@@,不准确@@,数据@@之间可能还有冲突@@。那么@@,开放这些数据@@@@让社会@@利用@@@@,可能不仅不能带来收益@@,还会造成损失@@。这样@@,在开放数据@@@@之前@@,还需要对数据@@质量@@进行整体提升@@。
 
  第五个问题是@@,政府@@部门有没有一整套制度和能力来开放数据@@@@@@?开放政府@@@@数据@@@@对政府@@来说@@@@@@,是一项全新的工作和挑战@@,应由哪一个部门来主管这项工作@@?这个@@部门能力如何@@?体制架构和工作机制@@是否到位@@?
 
  开放数据@@@@的过程中@@,涉及很多管理@@、政策和技术的问题@@@@,所以@@开放政府@@@@数据@@@@还需进行能力建设@@,包括管理能力和人员能力@@。
 
  第六个问题和政府@@部门的组织文化有关@@。对政府@@部门的工作人员来说@@@@,创新其实@@是要承担风险的@@,政府@@部门里有一句话叫@@:“多做多错@@,少做少错@@,不做不错@@”。不做开放数据@@@@这项工作@@,就不会犯错@@,也不会有人来说@@我@@,但开放了@@之后@@@@,一旦哪里出了@@问题@@,我就可能被领导批评@@,被其他政府@@部门发现这些数据@@@@有问题@@,就会被公众批评@@。那多一事不如少一事@@,还是别做的好@@。
 
  开放政府@@@@数据@@@@是一个动态循环的生态@@系统@@
 
  在数据@@开放@@过程中@@,相应的政策法规@@、组织管理@@、数据@@管理和平台@@开发水平@@,决定着政府@@数据@@开放@@的水平@@;而@@在数据@@开放@@之后@@@@,数据@@利用@@者的利用@@方式和利用@@能力@@@@,将直接影响数据@@利用@@的效果@@,两者间的动态互动关系@@,共同决定开放数据@@@@的价值创造@@过程@@。
 
  从开放数据@@@@@@、利用@@数据@@到价值创造@@@@,是一个动态循环的过程@@。开放数据@@@@不是政府@@一个人的事@@。政府@@开放数据@@@@@@之后@@@@,由开发者来利用@@数据@@@@,为社会@@创造@@公共价值@@@@。政府@@开放的数据@@越多@@、价值越高@@、质量越好@@,数据@@利用@@者的数据@@利用@@能力@@越强@@@@,数据@@的利用@@效果就越好@@,创造@@的公共价值@@也越高@@,如此又促使政府@@开放更多@@高价值数据@@@@,形成良性循环@@。
 
  反之@@,如果政府@@开放数据@@@@@@不足或@@不当@@,数据@@开发者没有兴趣利用@@数据@@或@@错误利用@@数据@@@@,数据@@就无法产生价值甚至造成损失@@,政府@@也失去开放数据@@@@驱动力@@,形成恶性循环@@。
 
  国外有很多大赛@@,如纽约的@@@@Big Apps,鼓励你使用数据@@@@,用得好每年@@还有奖金@@。其实@@奖金不是最重要的@@,重要的是让社会@@都知道这件事@@,都来用你的数据@@@@。所以@@,开放数据@@@@的提供者和利用@@者@@,是共创的合作伙伴@@。
 
  政府@@,是数据@@的提供者@@,需要有一套管理机制@@@@。组织架构上@@,需要有一个部门来推动这些数据@@@@开放@@@@,跟@@其他部门协调@@,因为数据@@在别人手里@@,所以@@这个@@部门要推动别人信息数据@@开放@@@@。需要一套流程@@、机制@@、方法@@、组织文化来支持开放数据@@@@@@。奥巴马@@在推动美国开放数据@@@@时@@@@,在文件里专门提出要建立开放数据@@@@的文化@@,即从采集数据@@的这一天开始@@,就准备好要开放@@。
 
  还需要从数据@@层面保障数据@@开放@@@@。从数据@@层面而@@言@@,需要考虑数据@@格式与标准@@、数据@@质量@@、数据@@的可用性@@。有一个问题是@@,这些数据@@@@当时是政府@@行使行政职责而@@采集的数据@@@@,数据@@确实是正确的@@,但不一定对你有用@@。所以@@就要特别强@@调@@,开放数据@@@@时@@,要尽可能开放详细的元数据@@@@,也就是关于数据@@的数据@@@@,告知数据@@采集的背景@@,让利用@@者自己判断@@,这是否为自己所要的数据@@@@。
 
  接下来是平台@@建设方面@@,是一站式还是分散式@@,平台@@的架构@@、界面@@、功能等@@。这是最后@@一步@@。这一步哪怕做得再好@@,上面没有高价值的数据@@@@,那还是没有干货@@。数据@@和平台@@@@,都要靠后台管理做支撑@@。
 
  2010年@@左右@@,我去国际上参加各种会议时@@,发现他们@@更多@@在讨论@@“怎么开放@@”的问题@@,而@@后@@来各种国际研讨会上讨论的主题@@,更多@@是如何推动社会@@来利用@@这些开放的数据@@@@。
 
  数据@@开放@@了@@之后@@@@,一方面要推动利用@@@@,发挥其价值@@。另一方面@@,还要规避风险@@,防止滥用@@。大概三四月份@@,我去台湾大学@@交流时@@,他们@@(台湾大学@@)说@@,正在重点研究隐私保护的问题@@@@——开放数据@@@@虽然对单个数据@@集做了@@去隐私化处理@@,但是@@,社会@@把几组数据@@集放在一块之后@@@@,是否还能遵循去隐私的原则@@?通过@@几组数据@@的整体分析@@,也许还是能锁定到某个人@@。他们@@已经在研究这些问题了@@@@,这是数据@@开放@@之后@@的问题@@@@。
 
  另一方面@@,在数据@@利用@@这方@@,数据@@到底由谁在利用@@和开发@@?有普通公众@@,有机构客户@@,有增值开发者@@——即专业用户@@,还有科研人员@@,他们@@对数据@@会进行深度挖掘@@,甚至得出政策建议@@。也就是说@@@@,每个人使用的需求@@、利用@@的方式@@、利用@@的目的和能力都不一样@@@@。有些人可能只是拿去做可视化展现@@,有些人拿去开发实际应用@@。这些用户之间可以形成一种产业@@,一手的专业用户把数据@@拿去做开放应用@@,服务于普通用户@@。数据@@集不是每个老百姓都能看懂@@,需要专业人员进行挖掘分析@@,然后老百姓可以用起来@@。处在中间的数据@@开发者@@,就成了@@普通公众和政府@@之间的桥梁@@。
 
  初级普通用户@@,对数据@@的使用能力很低@@。他们@@面临一个新的问题@@@@。我们以前@@有@@“数字鸿沟@@”的概念@@,所针对的是和信息化产品相关的应用@@@@。这里提出新的概念@@@@,叫做@@“数据@@鸿沟@@”,政府@@确实是平等@@开放了@@@@,但公众的使用能力不同@@。就好比@@,生态@@圈中有老虎@@、老鹰@@、大象@@,还有一些小兔子@@、小虫子@@,在猎物能力方面有差异@@。而@@数据@@的用户也一样@@@@,需要有各种中间体把数据@@的价值一层层开发出来@@,让整个数据@@生态@@系统可持续地发展下去@@。现在国外的很多的研究和政策都在这个@@领域@@。我们还没有真正开放数据@@@@@@,这些问题并未充分展现出来@@,应用效果也还没有出来@@。
 
  纽约的@@Big Apps,2015年@@已经是第六年@@了@@@@。“城市即平台@@@@”,政府@@开放数据@@@@@@的平台@@@@@@,不是一个只在上面堆放信息的门户网站@@,应该是做成一个平台@@@@,我把数据@@放在上面@@,你们拿去用@@,用完之后@@还能把成果放在上面展现@@。
 
  在某种程度上@@,它和微信@@、微博等社交媒体平台@@相似@@,里面的内容不是专业人员采集编辑好@@,而@@是让你们自己挖掘@@,我只是提供一个平台@@@@。当时的纽约市@@长彭博说@@@@,要让政府@@推出这样@@一个平台@@@@,就像@@Facebook一样@@,老百姓是可写可读又可以写的@@。他说@@@@,只要你们愿意用这些数据@@@@为社会@@服务@@,我就愿意把这些数据@@@@开放@@给你们@@。
 
  最后@@是环境@@,有内部环境和外部环境@@。包括法律法规环境@@、政治环境@@、社会@@经济环境@@、组织环境@@、技术环境@@。比如@@,法律法规的环境@@,能否足够有效地支撑政府@@开放数据@@@@@@@@,政治环境@@是否足够支持开放@@,社会@@经济环境@@是否已经到了@@@@支撑开放的地步@@。
 
  开放出数据@@@@,能否形成创意的生态@@圈@@?总结起来是@@,政府@@开放数据@@@@@@,只完成了@@一半工作@@,数据@@被利用@@之后@@@@,才体现为效益与价值@@,包括经济收益@@、社会@@收益@@、政治收益@@,也可能有损失和风险@@。产生的价值反过来又会对社会@@技术@@、组织环境@@产生影响@@,如果开放数据@@@@的收益重大@@,环境会更有利@@。那么@@,相应的环境@@,是否有利于政府@@开放数据@@@@@@机制@@建设@@?机制@@一旦建立@@,又能否推动数据@@的管理@@、平台@@的建设@@?将数据@@开放@@到平台@@上之后@@@@,利用@@效果取决于用户的利用@@方式@@、利用@@能力@@。用户利用@@方式@@、利用@@能力@@的改变又取决于经济环境的支撑@@。
 
  这些因素之间相辅相成@@,要以生态@@系统的思维来看待开放数据@@@@@@。政府@@不仅开放数据@@@@@@,还要维护@@、培育这个@@生态@@圈@@。政府@@不要干预生态@@圈的发展@@,只需提供一个公平的数据@@开放@@利用@@的环境@@。
 
  在这个@@过程中@@@@,政府@@不需要特意去扶持谁@@。现在实行@@“互联网@@+”,各地政府@@都和大公司签约@@,大公司已经足够大了@@@@,其实@@并不需要政府@@帮助扶持@@,只要给大家公平的环境即可@@。政府@@过于支持大公司@@,有可能会帮助大佬们踩死小兔子@@,破坏生态@@圈的可持续发展@@。
 
  开放数据@@@@是一个生态@@系统@@。这是一个非常复杂的环境和动态的过程@@,涉及很多利益相关方@@,存在很多影响因素@@,这些影响因素之间也存在互动关系和因果回路@@。整个开放数据@@@@政策的制定和执行@@,要以公众需求为出发点@@,以创造@@公共价值@@为终极目标@@。
 
  上海@@开放数据@@@@大赛@@
 
  回到中国这里@@,去年@@@@、今年@@都有政府@@开放数据@@@@@@大赛@@。上海@@去年@@@@也做了@@类似比赛@@。借此机会@@,介绍一下八月启动的上海@@开放数据@@@@创新大赛@@SODA。
 
  今年@@重点选了@@交通领域@@,让相关部门开放数据@@@@@@,开放了@@交通违章数据@@@@、公交数据@@@@、出租车的数据@@@@、气象数据@@@@,以及微博上老百姓对交通的评论等等@@@@。把这些数据@@@@开发出来@@,让所有参与者都来运用这些数据@@@@@@,做可视化的展现或@@利用@@@@,看能解决什么样的交通问题@@。还有来自市场的与交通相关的数据@@@@,放在同一平台@@上@@,一起来开发利用@@@@。
 
  政府@@手中蕴藏着大量与生活息息相关的数据@@@@,就像@@一瓶苏打水@@,看上去悄无声息@@,但你只要一打开瓶盖@@,就瞬间迸发出无限的创意和能量@@。意味着可以把数据@@转换成温度@@,来温暖我们的城市@@。城市不是一个大公司@@,所有数据@@等待着经理来开发或@@分析@@,城市的智慧来自大众的智慧@@。市民可以一起来挖掘数据@@的价值@@,通过@@这些数据@@@@来深度理解@@、增值开发和创新运用@@,解决城市的问题@@@@,服务我们的城市@@。
 
  最后@@,在这个@@公众参与@@的平台@@@@@@,开放数据@@@@、众创协作@@,把我们的城市建成一个活的有机体@@,城市的每一个人都是有机体的组成部分@@,人人可以提供数据@@@@,向他人共享@@。这样@@开放数据@@@@就把我们链接起来@@,把城市建设成包容有趣的创意空间@@@@。你心中对未来城市的想象@@,也许可以通过@@@@SODA来实现@@。让便捷@@、平等@@、高效@@、安全的城市愿景变成@@现实@@。

责任编辑@@:admin