本讲座选自复旦大学数字与移动治理实验室主任@@、国际关系与公共事务学院副教授@@、院长助理郑磊@@于@@2015年@@11月@@29日在@@@@ RONG 系列论坛之六@@——大数据@@与政府治理研讨会上所做的题为@@《开放数据@@@@的价值与进展@@》的演讲@@。   

  首先非常感谢清华大学的邀请@@,从去年@@@@4月@@第一@@次@@来清华做开放数据@@@@讲座到现在@@已经是第四@@次@@到清华讲开放数据@@@@了@@。每次@@都有压力@@,一方面@@,既要讲新东西@@,准备新的干货@@,另一方面@@@@,每次@@又有新的人@@,有一些基本的东西看来还要讲第四@@遍了@@。
 
  我首先把基本概念先讲一下@@,然后重点将开放数据@@@@的实践@@,尤其是上海刚举办的@@SODA大赛@@,整个组织过程我都在@@参与@@,可以介绍一下这方面的情况@@。

  首先看看开放数据@@@@是什么@@?现在@@在@@理论界和实践界@@,还没有@@完全说清楚@@“政府信息公开@@”、“开放政府数据@@@@”、“信息共享@@”等概念之间的差别@@。今天我重点讲一下政府开放数据@@@@和政府信息公开@@的差别@@。

  第一@@个最大的差别是开放数据@@@@要把数据@@开放到底层的@@、原始的@@数据@@@@,而传统的政府信息公开@@是公开经过加工和分析的信息@@,甚至是一些文件@@。

  第二@@个区别是政府信息公开@@最主要的目的是保证公众的知情权@@,更多@@是政治和行政上的责任@@,要让公众知道政府在@@做什么@@,然后参与和监督@@;而开放数据@@@@的主要原因是由于政府在@@履行行政职责的过程中采集了大量的数据@@@@@@,这些数据@@原来只放在@@政府自己的后台@@,现在@@这些数据@@要不仅政府自己用@@,也要开放给社会来开发@@利用@@@@,推动大数据@@时代的到来@@。所以@@开放政府数据@@@@更多@@是要保障公众对政府数据@@的利用@@@@。
 
  下面举几个例子@@,美国最早通过@@@@《信息自由法@@》来推动信息公开@@,第一@@张@@USAspeding.gov是关于财政数据@@的公开@@,第二@@张@@recovery.gov是美国金融危机后七千亿美元救市计划的公开@@,你可以看到加州和纽约州投的钱比较多@@,点开地图上的每一个点@@,会告诉你这个地方多少钱@@,给到哪些机构@@,已经花了多少钱@@,创造了多少工作机会等等@@。

  下面这个是关于空气质量数据@@的公开@@,你可以看到全美实时的空气质量情况@@,绿色@@的空气质量比较好@@,黄色的有一点问题@@,红色的就是有毒了@@。中国近些年@@北京@@上海也开展了类似的环境信息公开工作@@。

  但是@@,以上所举的这些例子都不叫@@政府开放数据@@@@@@,这些叫@@政府信息公开@@@@。因为在@@这些网站上并不能下载数据@@集进行深度的挖掘利用@@@@。在@@这些网站上只能看到和知道数据@@@@,只能这样一条一条地查询@@,但不能把这@@些数据@@集拿走@@。所以@@这些网站还是在@@信息公开的层面@@,提供的是信息查询服务@@,还不是政府数据@@开放@@。

  上面是@@DATA.GOV,有美国联邦政府十几万个数据@@集@@可以下载@@,这样才是开放数据@@@@@@。还有英国的@@DATA.GOV.U也是@@,我们这周五还跟他们交流过经验@@。

  在@@这张表上@@,横向是从知情到利用@@@@,纵向是从信息层到数据@@层@@。开放政府数据@@@@在@@右上角@@,要开放到数据@@层@@,并且保证社会对数据@@的利用@@@@。政府信息公开@@是为了保障知情权@@,开放的是信息层@@。一些政府网站@@上也发布了一些数据@@@@,但这就像政府在@@大门上贴出一张告示@@,说这就是政府的数据@@@@@@分析结果@@,而政府数据@@开放是政府打开一个门@@,说这里面的数据@@@@@@,你们可以拿去用@@。过去还提过政府信息资源再利用@@@@,这和开放数据@@@@的差别是数据@@资源只给自己指定的公司用@@,但这可能涉及到数据@@资源权利寻租的问题@@。开放数据@@@@应该是如果你把数据@@给了@@A,就也可以给@@B,只要@@B也满足了基本条件@@。

  真正的开放数据@@@@要满足以上这些标准@@。数据@@是完整的@@、原始的@@、一手的@@、及时的@@,可获取的@@,有一个平台@@可以让我下载@@,而不是我私下里找你要@@,例如@@DATA.GOV这样的平台@@@@。开放数据@@@@是非歧视@@、非私有的@@,产权上来说这些数据@@属于公共资源@@,并不属于某个政府部门@@,而是属于社会的公共资源@@。免授权@@,获取过程中不再需要填一系列表格协议@@,就可以到网上下载@@,美国政府开放的数据@@@@我们中国人也可以去下载@@。

  在@@跟英国开放数据@@@@研究院的交流中他们也提到@@,开放与封闭数据@@并不是非一即零的关系@@,中间有一个过渡阶段@@,从完全封闭到完全开放中间有一个过渡阶段@@@@,有些是有限度的开放@@,有一些是授权的开放@@。

  为什么要开放数据@@@@@@?我们现在@@都在@@说数据@@是石油@@、是金矿@@。我们把数据@@比作一种底层的资源@@,他是原始素材@@,开放给社会以后@@,社会对这些数据@@进一步地挖掘@@、利用@@、开发@@,产生各种应用或者是提供决策支持@@,创造出商业价值和社会价值@@。就好比把底层的米开放以后@@,可以做成各种各样的饭@@,加工做饭的过程由社会和市场来完成@@,用的是他们自己的钱@@,来满足各种各样的需求@@。过去是数据@@层和应用开发@@层都由政府来完成@@,就是政府的数据@@@@@@,由政府自己来开发@@成一个个应用@@。但是@@如果这些数据@@不涉及到机密的话@@,政府为什么要自己来开发@@@@?开发@@出来的产品用户体验能比市场开发@@的更好吗@@?能满足各种精细化的需求吗@@?众口难调的问题怎么解决@@?再接下来@@,有足够的钱来推广吗@@?政府的人力财力精力可以做出一个极致化的应用吗@@?过去都是自己辛苦开发@@@@,做出来了老百姓还不满意@@,吃力不讨好@@,那不如把数据@@开放出来@@,让市场和社会来开发@@@@。

  这样一来@@,政府的治理模式就发生变化了@@,过去都是自己做@@,现在@@是政府开放数据@@@@@@,社会开发@@利用@@数据@@@@,两者形成一个开放式的@@、合作共创的模式@@,这也是@@创新@@2.0的思维@@。所以@@,总结起来可以说@@,开放数据@@@@能助力经济增长@@,走向创新驱动@@,提升公共服务@@,推动大众创业@@。

  2013年@@美国@@GIQ期刊的主编马里兰大学的教授@@Bertot就说@@:“大数据@@建立在@@开放数据@@@@的基础上@@”,不然一个个都是信息孤岛@@、数据@@孤岛@@,怎么可能带来大数据@@时代@@?在@@这种情况下@@,政府先把自己的数据@@@@开放出来@@,可以引领大数据@@时代的到来@@。

  那么开放数据@@@@难在@@哪里@@?第一@@,数据@@在@@哪里@@?有些政府部门对自己有什么样的数据@@@@资源并不完全了解@@,所以@@先要把清单整理出来@@。有时候你问他要数据@@@@,他说@@我没有@@@@,其实他是不知道他有@@,因为每个部门都是一条线@@,这个条线不知道哪条线有什么数据@@@@。

  第二@@,能不能开放@@?涉及到国家安全和隐私就不能开放@@,但是@@中间有很多模糊地带@@,不容易判定@@。

  第三@@,愿不愿意开放@@?可能出于部门利益不愿意开放@@,或者是有些政府部门认为这些数据@@非常专业@@,拿出去以后他们看得懂吗@@?他们会用吗@@?他们有兴趣吗@@?有这种想法@@。

  第四@@,数据@@好不好@@?数据@@质量有没有@@问题@@?数据@@的清洗@@、脱敏等等@@。

  第五@@,有没有@@这个能力开放数据@@@@@@?开放数据@@@@对政府部门来说是一个新的挑战@@,过去没有@@做过这样的经验@@。哪个部门管@@?有没有@@编制@@?有没有@@人@@?有没有@@这样的技能@@?所以@@体制机制和能力建设都要跟上@@。

  开放数据@@@@就是一种服务@@,是有风险的@@,一旦没有@@做好@@,数据@@出现质量问题@@,被用错了@@,还会涉及到责任@@,搞不好他们回过头来告政府@@。这样政府部门就会觉得不做不错@@,多做多错@@,少做少错@@。反正没有@@说一定要开放@@,那我就观望@@,先看看别的地方怎么做@@。

  我国开放数据@@@@的现状如何@@?北京@@和上海在@@@@2012年@@推出平台@@@@。今年@@我们选了七个有代表性的地方做了一个评估@@。看看开放数据@@@@到底做得怎么样@@,这些数据@@我们都已经发表过了@@,今天就只简单说一下@@。

  评估包括数据@@层和平台@@层@@。各地平均公开了@@278个数据@@集@@。数据@@总量上看武汉是全国第一@@@@,但是@@武汉可机读的数据@@@@只有@@一半@@,另外一半基本是@@PDF格式@@,不利于社会对数据@@的利用@@@@,不是真正的数据@@@@开放@@。

  开放的数据@@@@中@@86.25%是静态数据@@@@,甚至没有@@按照自己的承诺更新@@,只有@@17.21%按承诺在@@更新@@。只有@@无锡@@、海曙明确保障数据@@的永久免费@@,没有@@“现阶段@@”字眼@@。没有@@一个地方明确赋予对数据@@进行增值利用@@和分享@@的权力@@。在@@数据@@下载过程中也遇到一些壁垒@@,能不能在@@平台@@上提出数据@@请求@@,就是我需要什么数据@@@@,还能让别人也看见@@。目前只有@@宁波海曙的数据@@@@请求是完全开放的@@。

  平台@@层整体来说交互便捷性还比较差@@,缺乏高质量数据@@应用展示@@,沟通交流缺乏便捷性@@。

  上海数据@@开放的整体思路是未来三年@@以正面清单的模式@@,要求各部门按照清单开放数据@@@@@@,既有数量要求@@、又有质量要求@@,还有格式@@要求@@。三年@@后@@,则采用负面清单的思维@@@@。除了明确不能开放的@@,其他都要开放@@。
 
  然而@@,开放政府数据@@@@本身不会直接产生价值@@@@,只有@@政府开放了数据@@并被社会充分地利用@@@@,才会产生价值@@@@。所以@@政府数据@@开放出来之后@@,政府还需要做很多事情@@,来推动社会利用@@这些数据@@@@,生怕他们利用@@不充分@@。所以@@就搞了很多大赛@@@@。纽约搞了一个大赛@@叫@@@@Big APPs。
 
  今年@@上海经信委协调交通委@@,一共开放了@@1TB的数据@@@@,也组织了一个大赛@@@@,名称很好玩@@,叫@@SODA大赛@@。当我们把@@Shanghai Open Data Apps这几个词的首字母放在@@一起的时候@@,正好就是@@SODA,就是苏打水的意思@@。这正符合开放数据@@@@的理念@@。政府的数据@@@@就像封在@@瓶子里的苏打水@@,关着瓶盖的时候看上去悄无声息@@,但只要@@你把瓶子一打开@@,嘭的一声@@,数据@@的能量就迸发出来了@@。这个瓶子的@@logo是我当天晚上画了一个构思草图发到组委会的群里面@@,后来专业的设计师给画出来了@@。在@@SODA百强派对的时候@@,真的找来一个大瓶的香槟酒@@,上面写着@@SODA,嘭的一声@@把瓶子打开@@,意思就是数据@@开放了@@。
  最后来参赛的队伍的数量超出组织方自己的想象@@,主办方开始预计有两百个团队就不错了@@,到方案截止前@@,组委会跟评委们说@@,不得了@@,我们评委要很辛苦了@@,一共有五百多个方案交上来@@。一半是上海的@@,还有一半是来自上海以外@@,北京@@16%,广东@@6%,其他省@@4%,还有国外的团队@@。在@@世界上@@,一个城市一下子开放这么大的数据@@@@集也是@@很轰动的事情@@,所以@@很多都过来参加这个比赛@@。最后选出了一百个方案进入复赛@@。
  上礼拜@@SODA组委会开了复盘会庆祝一下@@。这个大赛@@的评委会是开放的@@,我们并没有@@开过几次@@正式的组委会会议@@,但是@@每天都深更半夜还在@@群里面讨论问题@@,反而讨论出了很多非常好的建议@@。用的是一种互联网的方式@@,平等开放的模式来组织大赛@@@@。甚至有学生的创业公司参与了大赛@@的组织工作@@。这是大赛@@当时的一些照片@@,决赛的时候来了两百多人@@。15支团队进入决赛进行路演@@,最后得大奖的是交大的团队@@,我当时也担任评委@@。
  最后交通委的领导上来发言@@,他说@@,本来我已经准备了一个文字稿@@,但现在@@我决定脱稿讲@@。他主要讲了几点@@:第一@@,大开眼界@@,还是要依靠科技创新@@;第二@@,大受启发@@,智慧在@@民间@@。第三@@,把这@@15个团队都请到交通委和相关处室对接@@,想办法让这些创意落地@@。最后他还说@@,可惜这次@@我们开放的数据@@@@还不够多@@,如果再多放一点数据@@@@,你们可能能做出更好的方案@@。这个大赛@@办完@@,交通委真正体会到了开放数据@@@@的价值@@,就有了内生的开放数据@@@@的动力@@。
 
  SODA大赛@@只是刚刚开始@@,如果只是一个大赛@@@@,那就太简单了@@,接下来就是怎么让这些方案落地@@,对社会产生价值@@@@,反过来@@,政府就会更愿意开放数据@@@@@@。大赛@@的第一@@波效果是征集了创新应用@@,聚集了一大批人才@@,对公众和政府部门普及教育开放数据@@@@的理念@@。第二@@波效果就是给城市提供更好的服务@@,推动创新创业@@,推动产业发展@@,最终产生一系列的社会价值和商业价值@@,同时又对政府提出了新的数据@@@@需求@@,政府更知道社会需要那些具体的数据@@@@@@,也看到了给社会带来的价值@@,就更有意愿开放@@。
  我们跟英国开放数据@@@@研究院交流时@@,他们说在@@英国也搞了类似的大赛@@@@,他们做了一个投入产出的研究@@,结果是这个大赛@@每投一块钱@@,回报是@@10倍@@。一些政府部门在@@考虑把数据@@卖钱@@,免费地开放数据@@@@对我有没有@@直接回报@@,我为什么不能收一笔钱呢@@?但是@@另外一种思维是@@,你开放出去之后@@,一波两波三波的效应能产生更大的价值@@,最后政府的税收会上升@@,比你直接卖数据@@能产生有更大的回报@@,世界银行的专家来复旦交流时也支持这个观点@@@@。
  所以@@,数据@@开放可以两条路同时走@@,一种是自上而下@@、由内而外的推动开放@@,通过@@内部的压力@@。另一种是像@@SODA大赛@@这样由外而内@@、自下而上的拉动@@,让政府部门看到开放数据@@@@后产生的效果@@,意识到开放数据@@@@对政府部门自身也有好处@@,从而变成内生的动力@@,效果甚至会自上而下地推动更好@@。所以@@,要充分调动数据@@的开发@@利用@@者@@,通过@@SODA大会这样的活动@@,在@@加上产业孵化@@,让开放数据@@@@这件事滚动起来@@,产生价值@@,让政府有更大的意愿开放@@。
  总体来说@@,开放数据@@@@到产生价值@@是一个非常复杂的动态的过程@@,涉及到各种利益相关方@@,有各种因果关系和利益关系@@,要使整个循环成为一个正循环@@,而不是成为一个堵塞的循环@@,就要让这件事产生效果@@,让政府更愿意开放@@。产生更好的效果了@@,也就更愿意开放@@,开发@@者也会更积极得来利用@@数据@@@@。
  政府要有一个生态系统的思维@@@@。开放数据@@@@不是甲乙方外包关系@@、购买服务的关系@@,政府要做的工作是培育围绕开放数据@@@@的生态系统@@。
  最后呼应一下早上张楠老师讲的观点@@@@,安全和数据@@开放不是一对矛盾@@,他们是一个相辅相成的过程@@。信息政策里有一个理论框架@@:第一@@个原则是保管的原则@@,把数据@@的安全和质量问题解决好@@;第二@@个原则是利用@@的原则@@,不仅要把数据@@管好@@,更要把数据@@充分利用@@起来@@,产生价值@@。两个原则互为补充@@,只有@@管好了数据@@@@,才能产生信任@@、降低风险@@,有利于更好地利用@@数据@@@@,反过来@@,数据@@利用@@得越好@@@@,创造的价值越大@@,政府就对你越信任@@,也更愿意推动利用@@@@。安全有保障@@,才会更愿意开放@@,利用@@得越好@@,政府也更愿意花力气去提升数据@@质量@@、保证安全@@。如果安全出了风险@@,利用@@就进行不下去了@@,数据@@不利用@@了@@,管理数据@@也就没有@@价值了@@。这就好比图书馆的工作不仅是为了管理书@@,管理的目的是为了让书被更好得利用@@@@,发挥它的价值@@。而只有@@管好书@@,才能更好地把书借出去@@,书借出去了@@,还要能管得好@@,收得回来@@,这两个是相辅相成的关系@@。开放和安全也是@@这样的关系@@。
  我们实验室从@@2011年@@开始关注和研究开放数据@@@@@@,2013年@@开始发表开放数据@@@@方面的论文@@,上个月@@刚在@@中国行政管理也发了一篇@@。今天由于时间关系@@,还没有@@讲透的地方@@,大家可以参考这些论文@@。谢谢大家@@!


责任编辑@@:admin