0、引言@@

  自@@2015年@@《国@@务院关于@@印发促进大数据@@发展行动纲要@@的通知@@》提出@@, 要@@在@@@@“2018年@@底前建成@@国@@家政府@@数据@@统一开放平台@@@@”以@@来@@, 如@@何建设和@@管理数据@@开放平台@@成为@@一个@@各方关注@@的问题@@@@。截至目前@@@@, 一些省市级@@的数据@@开放平台@@已先后建成并提供@@了许多宝贵的前期探索经验@@, 参见表@@@@@@1。但@@如@@表@@@@1统计@@, 我国@@现有@@的地方@@政府@@数据@@开放平台@@多采用@@专用模式@@, 即@@:针对特定机构需求@@、采用@@少数企业@@专用技术体系开发@@。这一模式曾在@@世界范围内被普遍采用@@@@, 具有@@可靠性易于@@验证@@、易于@@实施和@@管理@@、项目风险低等@@优点@@, 但@@也存在@@开放性不足@@、不利于@@广泛参与和@@创新的问题@@@@。因@@此@@, 在@@近年@@来的国@@际开放数据@@平台@@@@建设潮流中@@, 专用模式已逐渐被开源@@模式@@取代@@。

表@@1 国@@内省市级@@数据@@开放平台@@建设情况一览@@

640.webp.jpg

  国@@内一些学者@@, 如@@:鲍静等@@等@@提出@@@@@@, 采用@@“共@@享与开放的技术支撑与规范@@”是国@@际上的一种常见做法@@@@, 值得学习借鉴@@。2017年@@, 《国@@务院办公厅关于@@印发政务@@信息系统整合共@@享实施方案的通知@@》也明确指出@@@@, 要@@“有@@效推进政务@@信息系统整合共@@享@@, 切实避免各自@@为@@政@@@@@@、自@@成体系@@、重复投资@@、重复建设@@”。

  什么是开放数据@@平台@@@@建设的开源@@模式@@@@?开源@@模式@@是如@@何提出@@并逐渐成为@@主流的@@?发达国@@家如@@何借助开源@@模式@@发展开放数据@@平台@@@@@@?如@@何从@@理论上解释开源@@现象@@?本文尝试基于@@@@世界各国@@数据@@@@开放平台@@建设现状进行综合案例@@研究以@@回答上述基本问题@@@@。希望本文对国@@外相关经验的总结@@能起到@@抛砖引玉的作用@@, 为@@我国@@数据@@@@开放平台@@建设提供@@一些可供借鉴的资料@@。

  1、世界各国@@国@@家级数据@@统一开放平台@@的建设现状@@——基于@@@@60国@@数据@@@@

  作为@@参考@@, 本文首先统计@@了全球@@60个@@国@@家的国@@家级数据@@开放平台@@建设情况@@。选择依据是@@Open Data Barometer开放数据@@指数@@。该指数由@@非营利性组织@@“互联网@@基金会@@”统计@@。因@@60名以@@外多为@@欠发达地区@@, 未有@@专项建设计划@@@@, 故未纳入比较@@。

  1.1 建设国@@家数据@@统一开放平台@@是致力于@@数据@@开放的国@@家的共@@同选择@@

  在@@60个@@国@@家中@@, 已建成数据@@统一开放平台@@的国@@家为@@@@47例@@ (占@@78%) , 尚未建成的为@@@@13例@@, 其中@@我国@@计划@@于@@@@2018年@@底前建成@@。可见建设国@@家数据@@统一开放平台@@是世界各国@@致力于@@开放数据@@的共@@同选择@@、符合世界发展潮流@@。

  1.2 多数国@@家选择开源@@模式@@建设国@@家数据@@统一开放平台@@@@

  据统计@@@@, 本文调查的@@60个@@国@@家中@@, 已建成数据@@开放平台@@的有@@@@47国@@, 其中@@绝大多数采用@@开源@@模式@@@@, 共@@34例@@ (占@@72%) 。选择部分开源@@的为@@@@2例@@, 选择非开源@@的为@@@@11例@@。其中@@围绕@@CKAN开源@@系统@@建设的最多@@, 为@@28例@@ (占@@60%) , 其他分别为@@@@:DKAN (4例@@) 、u Data (1例@@) 、OGPL (1例@@) (见图@@@@1) 。其中@@, Socrata的部分技术工具和@@源代码仅对政府@@用户开放@@, 并非面向所有@@社会@@公众开放@@, 因@@此@@本文将基于@@@@@@Socrata的开放数据@@平台@@@@定义为@@部分开源@@@@。

  开源@@模式@@ (Open-source Model) 是指不依赖少数机构的封闭技术体系@@, 而@@是围绕某一开源@@系统@@为@@基础建设开放社区生态@@, 强调所有@@系统工具面向全社会@@免费开放共@@享@@、社会@@各界协同创新的分布式建设和@@治理模式@@。其中@@, 开源@@系统@@是指遵守开放源代码协议的可自@@由@@分发@@、修改和@@重用的软件系统@@。运用开源@@模式@@建设开放数据@@平台@@@@@@, 意味着不仅开放数据@@@@, 同时也开放所有@@用于@@数据@@平台@@建设的系统工具@@, 使@@任何社会@@机构和@@群体可以@@极低成本构建自@@己的开放数据@@平台@@@@@@。以@@英@@国@@为@@例@@介绍开源@@模式@@在@@国@@家数据@@开放平台@@建设中的应用发端和@@历程@@。

640.webp (1).jpg

图@@1 47国@@国@@家数据@@开放平台@@所用系统及案例@@数@@

  1.3 英@@国@@政府@@如@@何建设国@@家开放数据@@平台@@@@@@:开源@@模式@@的提出@@和@@实践@@

  英@@国@@开放政府@@数据@@平台@@是世界上最早提供@@政府@@数据@@开放的国@@家级平台@@之一@@, 于@@2009年@@底内部测试@@, 2010年@@初面向社会@@开放@@, 首批开放@@2 879个@@数据@@集@@。英@@国@@建设过程具有@@一定代表@@性@@, 开放数据@@之前已建成政府@@安全内部网@@ (相当于@@我国@@的@@“电子政务@@内网@@@@”) 及各部门电子政务@@系统@@。需要@@解决的关键问题@@是@@“数据@@孤岛@@”问题@@, 使@@“内网@@”各部门系统的数据@@互联互通并以@@统一的交互方式向@@“外网@@”提供@@。当时@@提出@@了两种模式@@:

  第一@@种是基于@@@@内部闭环的专用模式@@, 即@@:各分支机构仅以@@满足自@@身业务需要@@为@@要@@求@@, 所有@@数据@@经内部闭环定期汇集到@@新增的开放数据@@中心平台@@@@、统一处理后向公众开放@@。此模式集中治理数据@@@@, 无须制定公开标准@@, 可以@@委托少数企业@@封闭开发@@, 技术保密性较好@@, 可控性较强@@。但@@相应的问题@@是@@:从@@技术治理角度而@@言@@, 中心平台@@负担过重@@, 易导致@@中心失效@@;从@@社会@@@@治理角度而@@言@@, 减少了各部门和@@社会@@机构的协作机会@@, 不利于@@全社会@@普遍参与@@, 与开放精神不相吻合@@, 易导致@@更新不及时@@、利用率低@@等@@问题@@@@。

  第二@@种是发动社会@@资源开放协作@@、分布式治理的开源@@模式@@@@, 即@@:中心平台@@不负责直接管理所有@@数据@@@@, 而@@是凝聚共@@识@@、制定标准@@、免费提供@@通用工具帮助分支机构自@@建符合标准的对外开放数据@@平台@@@@@@, 形成元数据@@可跨系统同步@@、原始数据@@可互操作的分布式开放数据@@平台@@@@群落@@。全国@@中心平台@@仅负责通过一个@@中心编目系统管理分布式数据@@平台@@的元数据@@@@, 各分布平台@@的原始数据@@各自@@管理@@、自@@行更新@@。在@@收到@@用户请求时中心平台@@根据元数据@@描述从@@分布系统实时调用对应的数据@@集@@, 从@@而@@建立全国@@数据@@@@互联@@、服务互通的统一数据@@门户@@。学术界长期以@@来@@认为@@@@, 开源@@模式@@理论上可以@@降低中心平台@@的工作负担@@、减少重复建设@@@@, 且有@@利于@@开放创新和@@提高服务水平@@。但@@由@@于@@涉及多级政府@@和@@社会@@主体@@@@, 实施难度更大@@。最终在@@学术界的倡议下@@, 英@@国@@政府@@采纳了开源@@模式@@@@, 并主要@@实施了@@4项措施来保障新模式的执行@@:

  (1) 采取主要@@领导负责制@@。推进工作由@@时任首相戈登主持@@, 具体工作由@@内阁办公厅直接负责@@, 保证主导力量具备顺利实施相关项目的权威性@@。具体推进采用@@自@@上而@@下的模式@@:首先建设国@@家平台@@@@, 在@@此过程中制定统一标准@@、完成顶层设计@@、开发必要@@工具@@。在@@国@@家平台@@取得一定成效后向地方@@推广@@。

  (2) 聘请英@@国@@计算机科学家@@Tim BernesLee为@@项目实施的负责人@@。Tim Bernes-Lee是世界万维网@@ (World Wide Web) 的发明者和@@万维网基金会的发起人@@, 因@@推动互联网@@关键技术开源@@而@@享有@@盛誉@@。他的加入为@@英@@国@@政府@@提供@@了开源@@模式@@实施的必要@@经验@@, 并获得了全世界开源@@技术社区的关注@@和@@支持@@。

  (3) 与剑桥大学教授@@Rufus Pollock发起的开源@@公益组织@@“开放知识基金会@@”合作开发用于@@政府@@数据@@开放平台@@建设的@@CKAN开源@@系统@@。与包括@@公益组织在@@内的社会@@力量合作而@@非单独开发@@, 有@@助于@@吸纳社会@@资源@@、降低政府@@部门支出@@、提高项目的开放性和@@透明度@@, 有@@利于@@形成全社会@@共@@同参与的开源@@生态系统@@。

  (4) 制定鼓励开放标准和@@开源@@系统@@的政策@@, 推动开源@@生态建设@@, 如@@:在@@2010年@@发布@@的@@“开源@@、开放标准和@@重用@@:政府@@行动计划@@@@”中提出@@鼓励开源@@思维@@, 指出@@此举不但@@将促进政府@@内部创新@@, 也有@@利于@@刺激外部市场增长从@@而@@对@@IT产业和@@整体经济产生外溢效应@@。在@@2016年@@发布@@“技术代码实践标准@@”进一步指出@@@@, 应优先考虑开源@@软件@@, 并且如@@无特殊原因@@应将所有@@政府@@新获取的软件开放源代码@@。

  英@@国@@选择开源@@模式@@取得了成功@@, 并成为@@不少国@@家的效仿对象@@。以@@Open Data Barometer排名前@@20的国@@家为@@例@@@@, 18例@@采用@@了英@@国@@开源@@系统@@@@CKAN。其中@@, 美@@国@@政府@@在@@@@2013年@@放弃了原有@@系统@@, 基于@@@@CKAN重建@@了其国@@家开放数据@@平台@@@@@@。英@@国@@公务员局局长@@John Manzoni提出@@, “政务@@系统开源@@是英@@国@@政府@@最正确的决定之一@@, 是国@@家软实力的体现@@”。

  2、发达国@@家省市级@@数据@@开放平台@@的建设现状@@——以@@英@@美@@两国@@为@@例@@@@

  考虑到@@地方@@@@ (省市级@@) 数据@@开放平台@@从@@规模@@、需求和@@经费层面都可能与国@@家级平台@@存在@@差异@@, 我们选择美@@国@@全部@@50个@@州和@@@@GDP排名前@@50个@@城市的建设情况进行了研究@@。选择美@@国@@的原因@@是@@:国@@土面积@@、行政区划与我国@@相似@@, 且是最早建设数据@@开放平台@@的国@@家@@。为@@了考察地域差异的影响@@, 我们也补充了英@@国@@前@@20个@@城市的建设情况作为@@比较@@。英@@美@@两国@@同期开始建设@@, 都是公认发展较好的国@@家@@, 可比性较强@@。未选择两国@@全部城市的原因@@是@@, 排名超出选择范围的城市都尚未建设开放数据@@平台@@@@@@。

  2.1 美@@国@@省市级@@数据@@开放平台@@建设多采用@@@@Socrata为@@基础的开源@@平台@@@@

  在@@美@@国@@@@50个@@州中@@, 目前@@有@@@@18个@@州建设了统一数据@@开放平台@@@@ (data.gov公布是@@40个@@, 但@@是我们经过实际确认@@, 其中@@大部分仅提供@@政策文件公开或仅地理数据@@@@, 故未列入@@) 。在@@这@@18个@@州中@@:1个@@采用@@@@了@@DKAN, 13个@@采用@@@@了@@Socrata, 4个@@采用@@@@了@@非开源@@的专用系统@@, 见图@@@@2 (左@@) 。在@@前@@50大城市中@@, 有@@33个@@建设了数据@@开放平台@@@@, 其中@@:3个@@采用@@@@CKAN, 3个@@采用@@@@DKAN, 21个@@采用@@@@Socrata, 2个@@采用@@@@Junar, 4个@@采用@@@@专用系统@@, 见图@@@@2 (右@@) 。

  2.2 英@@国@@市级数据@@开放平台@@@@CKAN和@@Socrata采用@@率基本相当@@

  作为@@对比@@, 在@@英@@国@@前@@20大城市中@@, 有@@12个@@建设了数据@@开放平台@@@@, 其中@@:5个@@采用@@@@了@@CKAN, 5个@@采用@@@@了@@Socrata, 2个@@采用@@@@了@@自@@制系统@@。但@@英@@国@@大中型城市都采用@@@@CKAN, 仅小型城市采用@@@@Socrata, 导致@@CKAN的实际用户数量和@@影响力仍高于@@@@Socrata。

640.webp (2).jpg

图@@2 美@@国@@已建成的地方@@数据@@开放平台@@所用系统及占@@比@@

  从@@英@@美@@两国@@地方@@政府@@的选择来看@@, 地域因@@素确实对其决策产生了一定影响@@。英@@国@@地方@@政府@@倾向于@@@@CKAN (由@@英@@国@@非盈利组织开发@@) , 美@@国@@地方@@政府@@明显倾向于@@@@Socrata (由@@美@@国@@企业@@开发@@) 。结合法@@国@@也大力推动本国@@的@@u Data开源@@系统@@建设来看@@, 发达地区已共@@同认识到@@建设本地开源@@生态系统对开放数据@@事业和@@数据@@经济的可持续发展具有@@较大价值@@。为@@了这些长期收益@@, 有@@实力的地区宁愿选择短期内见效慢@@@@、投入大的方案@@。这就出现了中央@@-地方@@多种开源@@系统@@并存的可能性@@。以@@下以@@美@@国@@为@@例@@@@, 介绍开源@@系统@@整合在@@国@@家@@-地方@@多级数据@@平台@@网络方面的应用情况@@。

  2.3 美@@国@@国@@家和@@地方@@政府@@如@@何建设开放数据@@平台@@@@@@:利用开源@@系统@@整合多级开放数据@@网络@@

  美@@国@@推动开放数据@@平台@@@@建设与英@@国@@同期@@, 主要@@由@@奥巴马政府@@推动@@。2009年@@, 美@@国@@国@@家开放数据@@平台@@@@@@data.gov上线@@, 成为@@世界上第一@@个@@此类平台@@@@。但@@该平台@@仍采用@@传统的专用系统模式@@, 从@@各分支机构收集上传数据@@统一开放@@, 初期开放的数据@@集较少@@, 仅有@@@@47个@@。从@@2010年@@开始@@, 多个@@州市地方@@政府@@也开始建设本地开放数据@@平台@@@@@@, 大多购买本国@@@@Socrata公司的技术服务@@。2011年@@, 由@@于@@英@@国@@开源@@模式@@的成功@@, 美@@国@@和@@印度政府@@提出@@计划@@合作发展一个@@名为@@@@“开放数据@@平台@@@@” (OGPL:Open Data Platform) 的开源@@系统@@@@。但@@后来由@@于@@英@@国@@@@CKAN系统的良好发展势头@@, 到@@2013年@@美@@国@@放弃了@@OGPL计划@@, 转而@@基于@@@@@@CKAN重建@@。

  2013年@@5月@@9日@@, 奥巴马政府@@签署@@13642号行政命令进一步推动数据@@开放@@, 并明确了具体执行步骤@@。该行政令实际将具体开放数据@@的权利和@@责任下放到@@地方@@和@@分支机构@@, 但@@由@@中央政府@@制定标准@@@@、推广开源@@系统@@工具和@@执行过程监督以@@统筹进行@@, 避免各自@@为@@政@@@@。此行政令被认为@@激活了机构活力@@, 具有@@里程碑意义@@。此后两年@@内美@@国@@中央政府@@机构新增开放数据@@集超过@@5万个@@@@, 37个@@地方@@政府@@机构新增开放数据@@集@@3万个@@@@, 其中@@1万个@@@@地方@@数据@@集采用@@中央政府@@建立的统一元数据@@标准并将元数据@@同步更新至中央平台@@@@。2015年@@, 由@@于@@开源@@系统@@工具和@@开放机读接口标准的推广@@, 地方@@平台@@和@@分支机构到@@中央平台@@的元数据@@更新已经可以@@每天自@@动完成而@@无需人工处理@@。

  因@@此@@, 美@@国@@的开放数据@@平台@@@@不像英@@国@@那样有@@比较清晰的自@@上而@@下发展历程@@, 而@@是中央和@@地方@@同时开始探索@@。在@@顶层设计尚未明确的情况下@@, 地方@@政府@@已经开始先行先试@@。这一现象与我国@@过去几年@@的发展有@@相似之处@@。但@@美@@国@@政府@@外包服务市场起步较早@@, 已发展得较为@@成熟@@。得益于@@高度市场竞争@@, 美@@国@@大部分地方@@政府@@实际采用@@了同一技术系统@@@@, 即@@:Socrata, 相当于@@依靠市场力量部分统一了标准@@。Socrata相比同期的@@CKAN实际在@@云服务技术上有@@优势@@, 可以@@大幅度降低管理成本@@, 对政府@@几乎没有@@技术要@@求@@, 因@@此@@不仅受到@@美@@国@@地方@@政府@@青睐@@, 在@@英@@国@@也被一些规模较小的城市采用@@@@。但@@Socrata最初不开源@@@@, 在@@2013年@@美@@国@@政府@@重建@@国@@家数据@@开放平台@@时未被选中@@。为@@此@@, Socrata在@@2014年@@也不得不宣布开源@@@@, 但@@为@@商业@@利益考虑@@, 部分系统仅面向政府@@用户开源@@@@ (因@@此@@被本文定义为@@部分开源@@@@) 。此外@@, 另一家美@@国@@企业@@@@Nu Civic于@@2013年@@开发了完全开源@@的数据@@平台@@系统@@DKAN与之竞争@@, 被加州等@@地先后采用@@@@。自@@此@@, 美@@国@@实现了中央@@平台@@采用@@@@CKAN, 地方@@和@@其他机构采用@@多种开源@@系统@@竞争@@, 但@@基于@@@@开放元数据@@标准和@@开源@@机读接口执行自@@动化数据@@整合@@、全社会@@共@@同参与的多级开源@@开放数据@@网络@@, 如@@图@@@@3所示@@ (数据@@使@@用@@python从@@开源@@系统@@托管平台@@@@government.github.com抓取@@, 由@@gephi可视化@@) 。一些典型项目包括@@@@:美@@国@@政府@@的@@data.gov、波士顿公共@@图@@书馆的开放元数据@@项目@@、布里斯托大学的开放科研数据@@项目等@@@@。图@@3中可见@@, 英@@ (左@@上角节点群@@) 、美@@ (右@@上角节点群@@) 两国@@内部都形成了规模较大@@、互动频繁@@ (互动频次@@由@@连线的宽度表@@示@@) 的政府@@机构@@-社会@@组织@@-企业@@构成的开源@@网络@@, 彼此之间也建立了一定的联系@@, 构成了一定规模的国@@内和@@跨国@@开源@@生态系统@@。

640.webp (3).jpg

图@@3 英@@美@@等@@国@@政府@@开源@@生态系统的网络互动关系@@

  3、为@@何开源@@模式@@在@@全球开放数据@@平台@@@@建设中取得成功@@:一种社会@@@@—技术系统@@理论的观点@@@@

  英@@美@@等@@国@@案例@@体现了开源@@模式@@的优势@@。这一优势无法@@单纯从@@技术因@@素角度来解释@@, 如@@早期开源@@的@@CKAN在@@云计算技术方面不如@@当时@@尚未开源@@的@@Socrata, 但@@反而@@取得更好效果@@。近年@@来的研究成果表@@明@@, 社会@@因@@素在@@复杂信息系统建设过程中扮演了重要@@角色@@, 部分学者提出@@应采用@@社会@@@@—技术因@@素综合分析的理论框架进行研究@@, 认为@@开放数据@@平台@@@@不是一个@@单纯的技术平台@@@@, 而@@是一种多社会@@@@—技术资源@@互动的生态系统@@ (Socio-technical Ecosystem)。

  社会@@—技术系统@@理论是面对复杂系统设计和@@实践提出@@的一种研究范式@@。Bostrom和@@Heine等@@提出@@@@, “技术系统@@与过程@@、任务以@@及将输入转变为@@输出的技术因@@素有@@关@@”, 而@@“社会@@系统与人的因@@素@@ (态度@@、技能@@、价值观@@) , 人的关系网络@@, 回报机制以@@及权力结构有@@关@@”, “技术系统@@与社会@@系统往往会发生交互作用@@”, 共@@同构成社会@@@@—技术系统@@。

  Trist等@@总结@@了这一范式与过去单纯强调技术的研究范式的主要@@区别@@ (见表@@@@2)。

  社会@@—技术系统@@研究范式在@@提出@@后较长时期内并未引起信息系统建设领域的足够重视@@, 原因@@主要@@为@@@@:一是信息系统建设多以@@技术人员主导@@, 二是早期信息系统都较为@@简单@@, 并不包含足够复杂的社会@@结构@@。这一情况直到@@社交网络@@、维基百科等@@大规模@@Web2.0信息系统诞生后才有@@所改变@@。本文认为@@开放数据@@平台@@@@作为@@一种提供@@社会@@性公共@@服务的广域复杂信息系统@@, 正适用于@@社会@@@@—技术系统@@的理论模型@@, 且与本文案例@@研究所形成的证据链可以@@相互支持以@@解释各国@@实践经验@@。

表@@2 两种研究范式的对比@@

640.webp (4).jpg

  3.1 开放数据@@平台@@@@建设不是单纯的技术问题@@@@, 需要@@考虑到@@广泛社会@@@@—技术资源@@的开放参与@@

  过去的组织机构信息化过程往往存在@@唯技术论倾向@@。近年@@来的研究表@@明@@, 这种不完整的分析框架和@@工作思路易造成项目失败@@。例@@如@@@@, Meliha研究了欧洲公共@@管理机构中的知识管理系统模型@@, 发现社会@@因@@素和@@技术因@@素共@@同作用于@@组织知识管理系统发展@@, 且前者在@@公共@@知识产生领域的影响往往更大@@。Reyes等@@研究了大量政府@@信息系统建设的失败案例@@@@, 指出@@许多失败不是来自@@技术因@@素@@, 而@@是社会@@和@@组织因@@素@@, 建议将信息系统建设视为@@一个@@社会@@@@—技术动态互动的过程不断根据反馈进行迭代优化以@@提高实施的成功率@@。

  世界各国@@开放数据@@平台@@@@建设现状也吻合社会@@@@—技术综合分析的框架@@。例@@如@@@@, 美@@国@@建设开放数据@@平台@@@@起步早于@@英@@国@@@@, 在@@信息技术研发方面也有@@一定优势@@。但@@到@@了@@2013年@@, 建设成效却明显不如@@英@@国@@@@@@, 最终借鉴了英@@国@@经验重建@@其开放数据@@平台@@@@@@。其原因@@就在@@于@@美@@国@@政府@@早期将之视为@@单纯的技术问题@@@@, 采取大包大揽的封闭建设模式@@, 不重视社会@@子系统的作用@@。当时@@, 部分研究人员就指出@@这一模式并非最佳选择@@。如@@:David Robinson在@@《政府@@数据@@与看不见的手@@》一文中提出@@@@“政府@@无须也不应大包大揽@@, 应当理清自@@己的特长和@@职责@@, 并针对不足引入第三@@方协助@@, 包括@@:私人机构@@、公益组织或商业@@组织等@@@@”。英@@国@@从@@起始阶段就更重视社会@@因@@素@@, 以@@发展开源@@系统@@为@@联系纽带尽可能吸纳第三@@方社会@@技术资源@@@@, 取得了明显效果@@。再如@@@@, 非洲开放银行与@@Knoema公司合作@@, 借助后者的技术资源@@开发了非洲开放数据@@平台@@@@@@, 希望推动非洲开放数据@@工作@@, 但@@由@@于@@与当地社会@@系统脱节@@, 收效甚微@@。

  这些案例@@表@@明@@, 发展开放数据@@平台@@@@不是一个@@单纯的技术问题@@@@, 也不应是政府@@单方面的行动@@, 而@@是一个@@需要@@多种社会@@@@@@—技术资源@@开放参与的系统优化过程@@。开源@@模式@@的本质是摒弃技术决定论的旧范式@@, 转而@@采用@@社会@@@@—技术系统@@综合优化的新思维@@, 如@@英@@国@@@@“开放标准原则@@ (Open Standard Principles) ”和@@“政府@@信息技术战略@@ (Government ICT strategy) ”指出@@:开源@@有@@助于@@政府@@与社会@@组织@@@@、科研机构@@、企业@@、个@@人合作@@, 从@@而@@有@@利于@@构建一个@@开放参与的良好生态环境@@。

  3.2 开放数据@@平台@@@@建设是多种社会@@@@@@—技术因@@素的互动优化@@, 因@@地制宜打造开源@@系统@@生态是成功的动力@@

  社会@@—技术系统@@理论认为@@@@, 多种社会@@@@—技术资源@@在@@系统中不是简单的堆叠@@、各自@@为@@政@@, 而@@是存在@@不同角色之间的互动网络关系和@@组织优化过程@@。如@@Frank等@@的研究表@@明@@, 社会@@和@@技术资源@@赋能者是社会@@@@—技术系统@@中的关键角色@@, 他们之间的网络组织和@@互动是系统发展的主要@@推动力量@@。在@@开放数据@@平台@@@@建设过程中@@, 政府@@首要@@领导@@、关键技术专家@@、社会@@学家@@、社会@@机构和@@企业@@的负责人往往扮演着赋能者的角色@@, 将多样化的赋能者引入系统并建立沟通顺畅@@、相互信任的社会@@@@—技术资源@@网络生态是项目成功的动力@@。

  但@@由@@于@@各国@@各地区的情况不尽相同@@, 导致@@一个@@地区成功的社会@@@@—技术资源@@网络未必能在@@另一个@@地区完全复制@@。例@@如@@@@, 尽管英@@美@@两国@@最终都采用@@了开源@@模式@@@@, 实现了中央@@-地方@@-社会@@—企业@@的多级社会@@@@—技术资源@@构成的开源@@合作网络@@, 还相互借鉴了彼此的经验@@, 但@@美@@英@@两国@@的发展路径@@不尽相同@@。相对而@@言@@, 英@@国@@路径@@是自@@上而@@下推进@@, 政府@@与公益组织是主要@@赋能者@@;美@@国@@路径@@则是中央和@@地方@@同时推进@@、相互适应@@, 政府@@与商业@@机构是主要@@赋能者@@。主要@@赋能者的差异也是美@@英@@两国@@政府@@开源@@政策的差异@@。英@@国@@的@@开源@@政策更强调面向公众开放@@, 而@@美@@国@@的政策更强调版权@@、安全和@@隐私@@。如@@英@@国@@@@的@@数字服务标准@@ (Digital Service Standard) 提出@@要@@开源@@所有@@政府@@新建的数字服务系统@@。而@@2016年@@美@@国@@制定的联邦源代码政策@@ (Federal Source Code Policy) , 仅要@@求每个@@国@@家机构在@@其每年@@新定制开发的软件中开源@@至少@@20%的代码@@。另外@@, 英@@国@@政府@@的所有@@开源@@系统@@和@@工具均面向公众开放@@, 而@@美@@国@@政府@@则设立了政府@@开源@@软件统一门户网站@@code.gov以@@管理内部开放问题@@@@。经本文统计@@@@, 目前@@该网站上托管的开源@@软件涉及国@@际开发@@、商业@@、农业@@、教育@@、国@@防等@@@@25个@@机构的@@114个@@项目@@, 其中@@有@@@@41个@@项目@@ (37%) 仅限政府@@部门内部开源@@@@, 需要@@联系主管部门才能获取源代码@@, 并不对公众开放@@ (即@@部分开源@@@@) 。

  目前@@看来@@, 英@@国@@的@@建设现状更开放@@、统一及有@@序@@, 而@@美@@国@@的建设现状则更好地照顾了企业@@利益和@@商业@@运作@@。因@@此@@在@@具体发展过程中@@, 在@@借鉴成功经验的同时@@, 还必须结合本地具体情况制定政策@@、确定主要@@赋能者@@、优化社会@@@@—技术资源@@、构建互动网络生态@@。

  4、建议和@@讨论@@

  4.1 采用@@开源@@模式@@建设数据@@开放平台@@@@

  各级各地政府@@的数据@@开放平台@@从@@功能上看高度相似@@, 各自@@封闭开发是一种效率较低的选择@@, 存在@@以@@下缺点@@:第一@@, 重复开发@@, 浪费资金@@;第二@@, 数据@@格式@@、标准难以@@统一@@, 不利于@@数据@@互联互通@@;第三@@, 不利于@@社会@@@@—技术资源@@整合@@, 技术迭代慢@@、内容更新少@@、利用率低@@。多国@@实践现状表@@明@@, 开源@@模式@@有@@助于@@解决上述问题@@@@。例@@如@@@@, 美@@国@@政府@@首席信息官@@Tony Scott总结@@:美@@国@@政府@@各部门每年@@用于@@购买定制软件的开销高达@@60亿美@@金@@, 采用@@开源@@系统@@通过政府@@内部共@@享源代码可大幅降低成本@@, 促进政府@@的信息技术创新并有@@利于@@开源@@软件社区发展形成技术外溢效应@@。本文建议优先采用@@开源@@模式@@建设数据@@开放平台@@@@@@。

  具体实现路径@@有@@两种可能@@: (1) 选择已有@@的国@@外开源@@系统@@为@@基础@@, 如@@:CKAN和@@DKAN; (2) 选择自@@行研发并发展本地开源@@生态系统@@。路径@@1的优点是@@:国@@外现有@@开源@@系统@@已比较成熟@@, 在@@多国@@实践中得到@@验证@@, 全球开源@@社区发展完备@@, 功能更新速度快@@。故此路径@@实施难度低@@, 投入成本小@@, 是目前@@世界上大多数国@@家的主流选择@@。路径@@2的优点是@@:虽然投入大@@、见效慢@@, 但@@可以@@通过政府@@投入建立本地技术体系@@, 推动数据@@技术研发@@, 促进开源@@生态建设和@@人才培养@@, 长期收益更大@@。目前@@, 英@@、法@@、美@@等@@国@@均推动本地开源@@生态系统建设@@。

  4.2 基于@@@@云平台@@部署数据@@开放平台@@@@

  云平台@@是一种大规模可开放使@@用的标准化计算基础设施@@, 具有@@初期投入低@@、可扩展性好@@、易管理等@@特点@@。从@@社会@@@@—技术系统@@分析框架出发@@, 云平台@@不仅是一种重要@@的技术资源@@@@, 而@@且有@@利于@@为@@政府@@@@—企业@@—社会@@组织@@的开源@@合作网络提供@@统一的基础设施@@, 促进交流合作@@。从@@各国@@各地区实践案例@@来看@@, 得到@@了广泛采用@@并取得了良好效果@@。建议优先考虑以@@云平台@@为@@硬件基础设施部署数据@@开放平台@@@@。从@@国@@外的实践来看@@, 国@@家级平台@@及少数大型机构平台@@建设政府@@云@@, 而@@大多数中小型机构采用@@政企合作@@、购买服务的模式在@@企业@@已有@@的公共@@云上托管数据@@开放平台@@是一种常见选择@@。

  云服务一般可分为@@三个@@层次@@@@:基础设施即@@服务@@ (Iaa S) 、平台@@即@@服务@@ (Paa S) 、软件即@@服务@@ (Saa S) 。目前@@国@@内的云平台@@服务商大多仅为@@公共@@部门提供@@前两个@@层次@@@@, 距离国@@外企业@@提供@@完整三个@@层次@@的云服务仍有@@差距@@。完整的云服务与开源@@模式@@结合@@, 可以@@更好地降低技术门槛和@@初期投入@@。不但@@有@@助于@@公共@@部门降低成本@@, 也有@@助于@@技术外溢和@@数字经济创新@@。

  4.3 培育和@@依托本地开源@@社区生态@@

  开放数据@@平台@@@@需要@@吸纳大量社会@@@@—技术资源@@来不断更新改良其功能并利用数据@@开发出更多@@有@@益于@@全体人民的服务@@。这项工作不可能仅由@@政府@@或少数企业@@来完成@@。因@@此@@发动群体智慧@@, 引入关键的社会@@@@—技术赋能者@@, 培育开源@@软件社区生态@@, 让人民服务人民@@, 是开放数据@@平台@@@@建设过程中公认的最佳实践@@。一些成功模式如@@英@@国@@@@的@@@@my Society.com和@@美@@国@@的@@codeforameria.org, 在@@各地帮助建立了上百个@@团队组成的开源@@合作网络@@, 为@@数据@@开放和@@利用做出了很大贡献@@。

  相关学术研究也指出@@@@, “建立一个@@健康的开源@@社区生态系统对于@@打造公共@@部门信息产品的可持续生态以@@实现长期发展至关重要@@@@”。建议我国@@主管部门出台政策鼓励类似非营利组织和@@开源@@社区的组建@@, 给予一定政策@@、数据@@、甚至经费支持@@。

  4.4 尽快建立并明确声明全国@@统一的数据@@开放使@@用授权协议等@@开放数据@@标准@@

  我国@@目前@@各地平台@@建设中标准不统一@@、不规范的情况比较严重@@, 阻碍了社会@@@@—技术资源@@协同网络的形成@@。以@@数据@@开放使@@用授权协议为@@例@@@@, 根据对国@@内已建成平台@@的调查@@, 本文发现目前@@各地平台@@的数据@@开放授权协议差异较大@@。有@@的平台@@甚至没有@@明确的授权协议@@, 仅以@@免责声明@@代替@@。严格意义上来说@@, 没有@@明确授权的开放数据@@甚至不能称之为@@开放数据@@@@。在@@权责声明不够清晰的情况下@@, 潜在@@的法@@律担忧将阻碍使@@用意愿@@。此外@@, 在@@数据@@混合使@@用时@@, 多种的授权协议也容易造成混乱@@, 引发数据@@侵权@@、数据@@滥用等@@问题@@@@。从@@国@@外实践来看@@, 一般由@@国@@家制定统一的@@“开放政府@@授权协议@@”。如@@无特别声明@@, 则公共@@部门自@@身创建的所有@@数据@@可默认适用该授权协议@@。一些可供参考的案例@@包括@@@@:英@@国@@的@@“公共@@部门信息开放政府@@授权协议@@@@” (Open Government Licence for public sector information) 、加拿大的@@“开放政府@@授权协议@@” (Open Government Licence) 和@@美@@国@@的@@政府@@工作版权协议@@ (Government Works Copyright) 等@@。

  附录@@

主要@@开放政府@@数据@@平台@@的系统简介@@

640.webp (5).jpg

责任编辑@@:李泰民@@