摘要@@

 
  大@@数据@@@@正在@@成为@@国家的重要战略资源@@,已是社会各界关注@@的焦点@@。从@@大@@数据@@@@的概念入手@@,界定了大@@数据@@@@概念的内涵@@、外延@@,指出@@政务@@大@@数据@@@@@@应用应成为@@政府@@管理@@改革的全新阶段@@。基于国内外政务@@大@@数据@@@@@@发展现状@@@@,在@@评述国内外政府@@大@@数据@@@@应用发展的基础上@@,提出中国政务@@大@@数据@@@@@@发展需坚持整体性政府@@@@@@、透明化政府@@@@和@@服务@@型政府@@@@三@@个@@基本方向@@,需避免@@将将大@@数据@@@@等@@同于开放数据@@@@@@、共享数据@@和@@海量数据@@三@@大@@认识误区@@,需警惕数据@@权的恶意使用或过度滥用@@@@、大@@数据@@@@带来的信息歧视和@@互联网@@公司侵害国家数据@@主权三@@大@@潜在@@问题@@。
 
  近年@@来@@,大@@数据@@@@在@@全球范围内受到@@追捧@@。据国际数据@@资讯@@(IDC)公司监测@@,全球数据@@量大@@约每两年@@翻一@@番@@,预计到@@@@2020年@@,全球将拥有@@35ZB的数据@@量@@。据统计@@,平均每一@@秒即@@有@@200万用户在@@使用@@Google搜索@@,Facebook注册用户超过@@10亿@@,每天生成@@300TB以上的日@@志数据@@@@。同时@@,传感网@@、物联网@@、社交网络等@@技术@@迅猛发展@@,引发数据@@规模爆炸式增长@@,大@@数据@@@@时代@@已经到@@来@@。著名的管理@@和@@咨询@@公司麦肯锡@@(McKinsey)认为@@,“大@@数据@@@@已经渗透到@@工业和@@商业领域的各个@@方面@@,成为@@影响生产的一@@个@@重要因素@@”,大@@数据@@@@的应用涉及经济@@、文化@@、教育@@、医疗@@、公共管理@@等@@各行各业@@。正是由于@@大@@数据@@@@的广泛应用及其背后蕴藏的巨大@@潜力和@@价值@@@@,许多国家纷纷将@@“大@@数据@@@@”的建设和@@发展上升为国家战略@@,积极推动大@@数据@@@@应用的发展@@。
 
  中国政府@@虽已发布@@《促进大@@数据@@@@发展行动纲要@@》,将数据@@定性为国家基础性战略资源@@,但各级政府@@在@@推动政务@@大@@数据@@@@@@应用方面@@,仍存在@@不少问题@@。所谓政务@@大@@数据@@@@@@@@,是指政府@@推动大@@数据@@@@应用发展的过程或大@@数据@@@@在@@公共服务@@领域的应用实践@@。本文在@@评述国内外政务@@大@@数据@@@@@@应用发展的基础上@@,界定了大@@数据@@@@的概念内涵和@@外延@@@@,指出@@中国政务@@大@@数据@@@@@@应用发展的方向及应避免@@的认识误区和@@需警惕的潜在@@问题@@。
 
  一@@、大@@数据@@@@的概念内涵及其外延@@@@
 
  对于大@@数据@@@@概念的界定@@,目前@@尚无统一@@的认识@@。由于@@所从@@事学科领域的差异@@,国内外学者对@@“大@@数据@@@@”有不同的看法@@。一@@些学者从@@计算科学角度出发@@,认为@@大@@数据@@@@是指无法在@@可容忍的时间内用传统@@IT技术@@和@@软硬件工具对其进行感知@@、获取@@、管理@@、处理和@@服务@@的数据@@集合@@。[1]还有学者从@@信息资源的角度出发@@,指出@@大@@数据@@@@是具有更强的决策力@@、洞察发现力和@@流程优化能力的海量@@、高增长率和@@多样化的信息资产@@。[2]而近年@@来@@@@,从@@事社会科学领域研究的学者认为@@@@,大@@数据@@@@的概念内涵不应仅仅局限在@@技术@@层面@@:大@@数据@@@@可以定义为在@@合理时间内采集大@@规模资料@@、处理成为@@常规使用者更有效决策的社会过程@@。[3]基于现有学者对@@“大@@数据@@@@”的研究@@,本文从@@大@@数据@@@@的内涵@@、外延@@出发@@,分别作界定@@(参见图@@@@1)。

大@@数据@@@@概念的内涵及外延@@@@

图@@1 大@@数据@@@@概念的内涵及外延@@@@
 
  从@@概念内涵来看@@,大@@数据@@@@是指海量数据@@@@,泛指大@@规模或超大@@规模的数据@@资源集合@@。与传统数据@@相比@@,大@@数据@@@@具有新的特点@@,现可概括为@@“5V”,即@@Volume(数据@@规模大@@@@)、Velocity(处理速度@@快@@)、Variety(数据@@类型多@@)、Value(价值密度低@@)、Veracity(数据@@准确性低@@)。
 
  从@@概念外延@@来看@@,大@@数据@@@@还具有如下三@@个@@层面的含义@@:
 
  一@@是指一@@种新型的研究@@方法或发现新知识的分析技术@@@@。这是因为大@@数据@@@@不仅强调数据@@量大@@@@,更重视海量数据@@背后的价值信息@@。从@@本质上说@@,大@@数据@@@@是应对人类数据@@量剧增挑战而产生的一@@种新技术@@@@。据统计@@,全球约@@90%的数据@@产生于最近两年@@间@@@@,目前@@每天新增数据@@量达到@@@@2.5TB。[4]IDC的预测则指出@@@@,2011年@@全球数据@@总量约@@1.8ZB,到@@2020年@@则将激增到@@@@40ZB,其中文本@@、视频@@、图@@片等@@非结构化数据@@占比将达到@@@@75%。面对这样一@@个@@全球数据@@的爆炸性增长@@,没有一@@套全新的数据@@处理和@@分析技术@@是无法想象的@@。
 
  二@@是指由数据@@驱动的新型决策机制@@。Gang-Hoon Kim等@@认为@@@@,大@@数据@@@@技术@@属于第五@@代决策分析技术@@@@。[5]在@@大@@数据@@@@@@时代@@@@,小到@@商业机构的营销分析@@,大@@到@@公共领域的政府@@决策@@,越来越多地依靠数据@@作出@@。这种基于数据@@驱动的新型决策机制@@,表明了大@@数据@@@@不仅仅是一@@种技术@@@@,更是一@@种理念创新和@@模式@@创新@@。如美国@@沃尔玛连锁超市因@@“啤酒与尿布@@”的购物篮数据@@分析而获得大@@量利润@@,美国@@总统奥巴马依靠竞选团队的数据@@分析而作出的竞选决策等@@@@,都是大@@数据@@@@时代@@由数据@@驱动决策的经典案例@@。
 
  三@@是指数字时代下的新型治理模式@@@@。大@@数据@@@@不仅仅是政府@@管理@@的一@@种新手段或新工具@@,它还将带来政府@@管理@@改革的一@@个@@全新阶段@@。随着大@@数据@@@@在@@政府@@管理@@和@@公民社会生活@@的深入@@,政府@@部门@@内部及其与公民社会的关系将被重新建构@@。技术@@、组织@@、关系和@@行为的再造呼唤全新的管理@@模式@@的出现@@,这种新的管理@@模式@@就是数字时代的治理@@。[6]这种创新的治理模式@@不只是政府@@内部自@@身的数字化变革@@,还将是广泛深远的社会变革和@@管理@@方式的创新@@。[7]从@@这个@@层面看@@,由大@@数据@@@@应用带来的数字治理模式@@创新将成为@@政府@@管理@@改革的全新阶段@@。Amanda Clarke等@@认为@@@@,在@@过去的@@100年@@间@@,政府@@机构设置经历了三@@种模式@@@@(参见图@@@@2)。[8]

图@@2 行政管理@@的三@@种模式@@@@
 
  首先是韦伯模式@@@@,其基本特征是基于书面文献和@@大@@规模科层级结构的控制模式@@@@。[9]在@@这一@@模式@@下@@@@,政府@@信息化致力于社会集成@@,即@@办公自@@动化@@,政府@@获取@@和@@掌握数据@@资源的能力较弱@@。从@@20世纪@@60年@@代开始@@,韦伯式政府@@机构开始面向数字化转型@@@@,但其数据@@主要来自@@内部业务运转@@,是一@@个@@封闭和@@不透明的系统@@。在@@韦伯式结构中@@,很少使用数据@@来理解公民的想法@@,并为政策制定提供依据@@。
 
  自@@20世纪@@80年@@代到@@@@21世纪@@初@@,新公共管理@@@@(NPM)模式@@成为@@政府@@管理@@改革的主要模式@@@@,该模式@@强调大@@型部门@@的解构@@,引入政府@@机构间竞争机制以及业务线管理@@机制等@@@@。[10]在@@这一@@模式@@中@@,信息技术@@在@@最初被用于更好地传递服务@@之后@@,也逐渐被边缘化了@@,因为激进的@@NPM理论认为@@信息技术@@技能应当剥离给外部服务@@供应商@@。[11]由于@@政府@@@@IT部门@@被外包出去@@,甚至@@在@@某些情况下被私有化@@,公民使用政府@@服务@@所产生的数据@@被计算机服务@@商所拥有@@,从@@而与服务@@供给脱节@@。且由于@@担心招来不必要的政府@@审计@@,这些服务@@提供商往往选择雪藏这些数据@@@@,而不是将其反馈到@@政府@@决策过程之中@@。[12]这些情况的出现@@,实际上导致@@NPM模式@@下@@的政府@@机构既不了解公民也不了解他们自@@己@@。
 
  自@@2000年@@以来@@,一@@种新的公共管理@@模式@@@@——数字时代治理@@(Digital-Era Governance,DEG)模式@@出现@@。[13]这种模式@@将数字化技术@@置于机构层级的核心位置@@,恢复了被@@NPM模式@@所阻隔的@@“政府@@—公民数据@@流@@”。DEG模式@@的基础有三@@@@,即@@对纸质和@@基于电话的信息系统的完全数据@@@@化@@,以用户为中心的服务@@一@@体化@@,以及对碎片化政府@@机构的重组与整合@@。在@@DEG模式@@下@@,政府@@将跨层级的数据@@管理@@从@@原先的私人部门@@管理@@转移到@@集中化的@@“智能中心@@”模式@@,这种模式@@类似于沃尔玛的大@@数据@@@@仓库管理@@模式@@@@,比原来的政府@@数据@@管理@@模式@@有效得多@@。大@@数据@@@@的兴起@@,正好与政府@@管理@@模式@@的这一@@变革遥相呼应@@。
 
  二@@、国内外政务@@大@@数据@@@@@@发展现状@@
 
  由于@@“大@@数据@@@@”的广泛应用以及@@“大@@数据@@@@”蕴藏的巨大@@潜力和@@价值@@,许多国家纷纷将@@“大@@数据@@@@”的建设和@@发展上升为国家战略@@。2012年@@3月@@29日@@,美国@@正式发布了@@@@《大@@数据@@@@研究和@@发展倡议@@》(Big Data Research and Development Initiative)[14],该倡议书中提到@@@@,大@@数据@@@@计划@@的实施@@,旨在@@帮助美国@@获得从@@海量复杂数据@@集中萃取知识的能力@@,借此提高国家应对急迫挑战的能力@@。这一@@计划@@类似于过去美国@@联邦@@政府@@在@@高性能计算和@@互联网@@等@@领域的战略性投入@@,并旨在@@推动国家在@@科学研究@@、教育@@和@@国家安全等@@领域的能力提升@@。该倡议书的发布@@,标志着大@@数据@@@@已经上升成为@@美国@@在@@计算服务@@领域的国家战略@@。英国@@、加拿大@@@@、新加坡@@、日@@本@@、韩国@@等@@国家纷纷推出了以开放@@、融合@@、创新为特征的新一@@轮信息技术@@革命推进政策@@。如英国@@政府@@所宣布的一@@项价值@@1.89亿@@英镑的@@“大@@数据@@@@”发展计划@@@@,意在@@推动@@“大@@数据@@@@”在@@商业@@、医疗@@、农业和@@科学研究等@@方面的应用@@;法国政府@@发布的@@“数字路线图@@@@(Digital Roadmap)”,计划@@投资@@1000余万欧元用于支持包括大@@数据@@@@在@@内的@@7个@@尖端领域的研究@@@@;澳大@@利亚联邦@@政府@@发布@@“澳大@@利亚公共服务@@大@@数据@@@@战略@@”,以推动公共行业利用大@@数据@@@@分析进行服务@@改革等@@@@。2011年@@9月@@20日@@,美国@@、英国@@、挪威@@、墨西哥@@、印度尼西亚@@、菲律宾@@、巴西@@、南非等@@八国发起成立@@“开放政府@@联盟@@”,发布了@@《开放政府@@宣言@@》,目前@@全球已经有超过@@60个@@国家加入该联盟@@,贴近互联网@@@@、开发大@@数据@@@@@@、造福全社会已经成为@@当前@@发达国家政务@@信息化的主流声音@@。
 
  相较而言@@,国内对于大@@数据@@@@的研究@@起步较晚@@。始于@@1993年@@国家自@@然科学基金会成立的@@“大@@数据@@@@共享联盟@@”,以搜集和@@展示大@@数据@@@@的研究@@开发为主@@。自@@1999年@@起@@,“第三@@届亚太地区知识发现与数据@@挖掘国际会议@@”“Hadoop与大@@数据@@@@技术@@大@@会@@”和@@“大@@数据@@@@共享联盟@@”等@@才开始开展有关大@@数据@@@@研究和@@开发的促进工作@@。[15]2008年@@,“计算社区@@联盟@@”(Computing Community Consortium)在@@《大@@数据@@@@计算@@:在@@商务@@、科学和@@社会领域创建革命性突破@@》报告中详尽阐述了大@@数据@@@@对社会治理的推动作用@@,以及潜在@@的商业价值@@。[3]直到@@@@2013年@@,维克托@@·迈尔@@-舍恩伯格的@@《大@@数据@@@@时代@@:生活@@、工作与思维的大@@变革@@》一@@书才掀起国内的@@“大@@数据@@@@”热潮@@。自@@2013年@@以来@@,大@@数据@@@@、互联网@@、云计算等@@新兴产业得到@@了中国政府@@的高度重视@@。李克强总理在@@@@2014年@@《政府@@工作报告@@》中明确提出@@,要设立新兴产业创业创新平台@@@@,在@@大@@数据@@@@@@、云计算等@@方面赶超先进@@,引领未来@@产业发展@@。国务院常务会议多次@@专题@@研究部署推进互联网@@@@、大@@数据@@@@等@@新兴产业的快速发展@@,科技部@@、发改委@@、工信部等@@部委在@@科技和@@产业化专项中对新一@@代信息技术@@给予重点支持@@,在@@推进技术@@研发方面取得了积极效果@@。在@@国家层面的积极鼓励和@@倡导下@@,各地政府@@高度重视互联网@@@@、大@@数据@@@@、云计算等@@新兴产业发展@@。2014年@@2月@@,广东省率先提出设立广东省大@@数据@@@@管理@@局@@,并正式公布了@@《广东省大@@数据@@@@发展规划@@(2015-2020年@@)》,为大@@数据@@@@产业发展注入了强大@@动力@@。上海@@、北京等@@地率先推出了政府@@数据@@资源开放共享网络平台@@@@,整合本地区数十个@@部门@@的政务@@大@@数据@@@@@@资源@@,向全社会开放共享@@,为企业和@@个@@人开展政务@@信息资源的社会化开发利用提供数据@@支撑@@。贵州@@省提出建设@@“云上贵州@@@@”计划@@,并力争成为@@全国首个@@基于云计算建成省级政府@@数据@@共享平台@@的省份@@@@。重庆@@、内蒙古@@、陕西@@、湖北等@@地都提出建设大@@数据@@@@和@@云计算产业基地的计划@@@@,力图@@将新兴产业培育成本地的支柱产业@@。2015年@@4月@@,国家发改委@@在@@部委中首家专门成立了大@@数据@@@@分析中心@@——国家发改委@@互联网@@大@@数据@@@@分析中心@@,全面支撑国家发改委@@宏观调控和@@重大@@决策@@,这标志着中国大@@数据@@@@产业已经开始进入应用深化的全新阶段@@。
 
  三@@、政务@@大@@数据@@@@@@需坚持的三@@个@@基本方向@@
 
  (一@@)整体性政府@@@@
 
  整体性政府@@@@强调政府@@内部须实现机构@@、部门@@、专业@@、层级等@@之间的协调整合@@,以更好地解决公众需求@@,避免@@因政府@@内部矛盾冲突而造成的公共服务@@效率低下@@。Michael Milakovich指出@@,单一@@数据@@源已越来越难以满足应对很多政策领域日@@益复杂问题的需求@@,未来@@将会出现越来越多跨数据@@集的联系@@,且在@@数字时代@@,政府@@治理的关键在@@于整合多数据@@源的公共管理@@模式@@@@,因此@@,推动政务@@大@@数据@@@@@@应用首先应坚持整体性政府@@@@方向@@,推动政府@@间的数据@@共享与业务协同@@。[16]在@@英国@@@@,曾有报道称@@,由于@@缺乏跨部门@@沟通@@,当地警察部门@@和@@医院@@系统推进的一@@个@@分享@@暴力犯罪数据@@的项目最终宣告失败@@。[17]相比商业机构而言@@,政府@@在@@推进大@@数据@@@@方面所面临的挑战更加尖锐@@,因为他们必须在@@遵从@@安全性和@@相关法规的前提下@@,不断打破部门@@孤岛来推进数据@@的集成@@。[5]政府@@部门@@不仅要应对多数据@@源和@@不同格式数据@@的集成分析等@@大@@数据@@@@领域通行问题@@,还要面对很多政府@@部门@@特有的挑战和@@问题@@。但对推进政务@@大@@数据@@@@@@应用@@而言@@,无论是对政府@@自@@身监管行为所产生的大@@数据@@@@@@,还是对公民在@@社交媒体或其他网络平台@@上所产生的行为数据@@进行采集和@@分析@@,都可能促进政府@@机构中跨层级的@@“智能中心@@”的建立@@。如在@@美国@@@@@@“9·11事件@@”以后@@,借由国家安全之名@@,政府@@开始强力推进跨部门@@电子数据@@共享@@。如美国@@国土安全部高度强调跨部门@@数据@@的互操作性@@@@,并应用多种技术@@手段促进数据@@在@@市政部门@@@@、社区@@、医院@@、供血站@@、避难所等@@各类机构之间的顺畅流动@@。此外@@,美国@@在@@环保@@、交通@@、医疗@@和@@公共安全等@@领域的信息共享也取得了良好成效@@。
 
  (二@@)透明化政府@@@@
 
  R. C. Joseph等@@认为@@@@,大@@数据@@@@分析技术@@的使用@@,能够大@@大@@提升政府@@服务@@的效能@@。[18]大@@数据@@@@能够提升电子政府@@的效率和@@效果@@,并促进其进一@@步演化为透明政府@@@@(transformational government,t-government),这被认为@@是电子政府@@的最终演化阶段@@。[19]大@@数据@@@@应用建立在@@掌握数据@@的基础上@@,以海量数据@@为前提@@,政务@@大@@数据@@@@@@的发展往往离不开政府@@开放数据@@@@,这使得政府@@的透明度大@@大@@提高@@。纽约大@@学法学院教授贝丝@@·诺维克@@(Beth Novick)表示@@,数据@@的开放可以让政府@@公职人员和@@民众一@@起参与进来@@,解决政府@@无法完成的@@、棘手的问题@@,更广泛地发挥公众力量@@,借助大@@数据@@@@平台@@更好地进行社会管理@@@@。随着政府@@组织@@的行为及其与公众的交互越来越数据@@化@@,在@@政府@@自@@身内部系统中产生的各类大@@数据@@@@也为透明性政府@@建设提供了巨大@@潜力@@。在@@推进政务@@大@@数据@@@@@@应用@@中@@,政府@@的监管方式应不断创新@@,更加透明@@。在@@最极端的情况下@@,如果我们可以设想一@@个@@机构像维基百科那样完全进行数字化运作@@,那么通过下载其所有的编辑历史就可以提供该@@“组织@@”的所有完整的交互记录@@,从@@而提供了一@@种迄今为止难以想象的机会去理解其治理安排@@。[20]随着政府@@组织@@越来越@@“成为@@”一@@种前台的网络存在@@和@@后台的信息处理系统@@,大@@数据@@@@也将更有力地促进上述整体性政府@@@@的最终形成@@。
 
  (三@@)服务@@型政府@@@@
 
  大@@数据@@@@可以促进政府@@公共服务@@水平的提升@@,有利于服务@@型政府@@@@的建立@@@@。M. R. Rajagopalan等@@[21]指出@@,在@@大@@数据@@@@@@时代@@@@,公众可以更好地参与到@@政府@@工作之中@@,与政府@@分享@@信息@@,形成政府@@和@@公众共同参与的政务@@决策机制@@。[22]社会公众可以通过社交媒体@@、公开出版物@@、博客等@@渠道分享@@他们的意见@@,大@@数据@@@@分析技术@@可以处理这些非结构化数据@@@@,并将更好的服务@@和@@方案传递给所需的客户群体@@。因此@@,在@@大@@数据@@@@@@背景下@@,任何政府@@都可以藉由政务@@大@@数据@@@@@@的采集@@、分析和@@利用@@,不断推动优化政府@@自@@身运作流程和@@服务@@效能@@。而且@@,政务@@大@@数据@@@@@@分析是政府@@理解公民行为@@、解释政策与公共服务@@优劣的良好手段@@,也是政府@@决策者理解公众需求与偏好的工具@@,以更好地理解人们对于公民参与的积极性@@,对立法变动的态度@@[8],以及对政府@@公共服务@@的需求@@。美国@@国税局@@(IRS)曾经重新设计其纳税申报流程@@,并应用大@@数据@@@@技术@@手段来提高对纳税欺诈和@@纳税不遵从@@行为的自@@动监测@@。在@@美国@@@@,随着联邦@@政府@@各个@@机构对于大@@数据@@@@分析的应用@@,政府@@在@@处理自@@身事务时将花费越来越少的精力@@。此外@@,大@@数据@@@@还可有效改进政府@@绩效管理@@方法@@,促进公共服务@@的提升@@。Michael Milakovich指出@@,以往政府@@部门@@的绩效管理@@往往是滞后的@@,因为其主要依赖一@@些事后的指标来评估政府@@工作的效果@@。[16]未来@@,政府@@管理@@部门@@应当更多@@依靠实时性数据@@来提升政府@@管理@@效能@@。
 
  四@@、政务@@大@@数据@@@@@@需避免@@的三@@大@@认识误区@@
 
  (一@@)将大@@数据@@@@等@@同于开放数据@@@@
 
  由于@@目前@@尚无对@@“大@@数据@@@@”的标准界定@@,政府@@部门@@对大@@数据@@@@的认识存在@@混乱@@,有将开放数据@@等@@同于大@@数据@@@@@@,有将任何@@“大@@”的政府@@数据@@集的发布都当作是大@@数据@@@@@@。但事实上@@,很多开放数据@@只是离散的@@“小数据@@@@”,并不具备大@@规模@@、未经处理和@@非结构化等@@大@@数据@@@@的基本特征@@,且很多通过开放数据@@机构发布的在@@线数据@@集仅仅是一@@个@@可用的样本集@@。同时@@,虽然开放数据@@对于促进政务@@大@@数据@@@@@@应用意义很大@@@@,但当开放数据@@仅仅是由于@@上级部门@@的指令要求@@,并对政府@@部门@@本身工作并没有任何回馈时@@,开放数据@@项目就会缺乏可持续性@@。考虑到@@开放数据@@并不是不需要成本@@(公务员需要花时间去收集这些数据@@@@,并发布出去@@),在@@政府@@看不到@@任何收益的情况下@@,将其维持下去会很困难@@。在@@加拿大@@@@和@@英国@@@@,已经有证据表明@@,政府@@开放数据@@项目的可持续性受到@@了威胁@@,有些官员将开放数据@@描述为仅是由一@@小群爱好者推动的@@“桌角项目@@”。以美国@@的@@data.gov门户网站为例@@,其在@@@@2012年@@包含有@@378529个@@原始空间@@数据@@集@@、1264个@@政府@@@@APP和@@236个@@公民开发@@APP。然而@@,到@@2014年@@,该网站的数据@@集事实上已经下降到@@了@@108606个@@,且各种@@APP的数量也有所下降@@。这实际上也是因为网站数据@@集的可用性不佳造成的@@。[23,24]此外@@,为了便于开发者和@@分析者能够不受数据@@格式限制而处理数据@@@@,开放数据@@集都是以原始格式发布的@@,这将影响数据@@的获得和@@使用@@。由于@@编码缺乏一@@致性@@,这些数据@@在@@没有电脑归纳的情况下非常难以理解@@,从@@而难以得到@@真正有效应用@@。可见@@,在@@推动政务@@大@@数据@@@@@@应用中@@,不能简单地将大@@数据@@@@等@@同于开放数据@@@@@@。
 
  (二@@)将大@@数据@@@@等@@同于共享数据@@@@
 
  Gang-Hoon Kim等@@对美国@@@@、英国@@、荷兰@@、瑞士@@、新加坡@@、日@@本@@、韩国@@、澳大@@利亚等@@发达国家的@@24项政府@@大@@数据@@@@应用进行了统计分析@@,发现目前@@发达国家政府@@大@@数据@@@@应用与商业领域大@@数据@@@@应用相比@@,规模还有很大@@距离@@;且目前@@大@@部分政府@@大@@数据@@@@应用的对象仍以结构化数据@@为主@@,较少采用实时@@、动态@@、半结构化甚至@@非结构化数据@@@@。[5]这在@@中国政务@@大@@数据@@@@@@应用中也较为常见@@。据调查@@,目前@@很多地方政府@@建设的大@@数据@@@@平台@@@@,仅仅是过去政府@@共享数据@@平台@@的@@“翻版@@”。政府@@推动大@@数据@@@@平台@@建设的首要目的不是推动大@@数据@@@@应用@@,而是统一@@政府@@信息基础设施@@,实现各部门@@数据@@的互联互通@@。然而@@,政府@@大@@数据@@@@不仅仅是政府@@自@@身的业务数据@@@@,在@@当今社会@@,有大@@量对政府@@治理有意义的大@@数据@@@@源@@,如金融@@、电商@@、医疗@@、社交媒体等@@@@,并不完全由政府@@自@@身掌握@@。在@@推动政务@@大@@数据@@@@@@应用中@@,应逐步整合政府@@外部数据@@资源@@,建设国家层面的全国性大@@数据@@@@中心@@,形成更加完善的治理决策支持体系@@,以在@@数据@@整合的基础上实现服务@@整合@@。以澳大@@利亚@@Centrelink国家数据@@中心的建设为例@@,全国各地的@@Centrelink与数据@@中心直接联网@@,联邦@@、州@@、当地的服务@@机构@@,如税务部门@@@@、金融机构@@、警局等@@@@,也与数据@@中心实现联网共享@@;Centrelink在@@多种服务@@渠道的后台@@,借助信息通信技术@@将业务流程@@、服务@@、网络和@@资源进行优化整合@@,便捷@@、高效地为公众提供一@@体化的服务@@@@。
 
  (三@@)将大@@数据@@@@等@@同于海量数据@@@@
 
  随着大@@数据@@@@在@@中国的不断发展@@,各个@@地方都开始兴建大@@数据@@@@中心@@,但对于大@@数据@@@@中心的建设@@,更多@@地还停留在@@@@“建机房@@、上设备@@、堆数据@@@@”的阶段@@,忽视了大@@数据@@@@强调的是对数据@@的分析和@@应用@@。对于政务@@大@@数据@@@@@@的推进或大@@数据@@@@中心的建设@@,首先应有周密@@、严谨@@、细致的数据@@目录体系顶层规划@@,建立统一@@的数据@@资源目录体系@@、数据@@标准体系@@、数据@@质量审计体系和@@业务系统数据@@共享交换体系等@@@@;其次@@要有可对比@@、可回溯@@、可审计的数据@@质量管理@@体系@@,保障数据@@采集获取@@的可持续性@@,避免@@“数据@@陷阱@@”;再者@@,要有精通数据@@挖掘和@@业务建模的数据@@科学家队伍@@,从@@政务@@应用需求出发@@,做好潜在@@数据@@价值的挖掘与应用@@。此外@@,当前@@不少学者还未真正认识到@@大@@数据@@@@价值@@,认为@@海量数据@@无法获得@@,且大@@数据@@@@只是一@@种暂时性趋势@@。殊不知@@,大@@数据@@@@虽指海量数据@@@@,但并不是@@“全数据@@@@”,而是数据@@资源总量不断增长的状态@@,且从@@@@“大@@数据@@@@”中挖掘出有价值信息才是大@@数据@@@@应用的关键@@。
 
  五@@、政务@@大@@数据@@@@@@需警惕的三@@大@@潜在@@问题@@
 
  (一@@)警惕数据@@权的恶意使用或过度滥用@@
 
  随着大@@数据@@@@应用的不断推进@@,数据@@开始被视为重要的战略资源@@,“世界经济论坛@@”报告曾指出@@大@@数据@@@@为新财富@@,价值堪比石油@@。在@@政治领域@@,数据@@的所有权是一@@种新的权利源泉@@。围绕原始数据@@的占有权和@@发布权的斗争将成为@@一@@个@@持久性的政治议题@@。一@@个@@不可否认的政治事实是@@,意识形态的倾向性总是会影响对客观@@事实的调查@@,并且对决策过程产生导向作用@@。当前@@,数据@@权被滥用的案例普遍存在@@@@。如针对政府@@网站@@数据@@不准确问题@@,2001年@@美国@@政府@@颁布了@@《数据@@质量条例@@》(Data Quality Act),允许私人团体对联邦@@政府@@部门@@所发布信息的准确性提出质疑@@。很多反对美国@@环保政策的商业团队就经常利用这一@@条款来拖延环保监管工作的执行@@。这条法律变成了环境保护监管工作的一@@个@@巨大@@障碍@@,因为它经常被用来拖延那些必要的监管工作的正常开展@@。在@@推进政务@@大@@数据@@@@@@应用@@中@@,应警惕数据@@权的恶意使用或过度使用@@。
 
  (二@@)警惕大@@数据@@@@带来的信息歧视@@
 
  大@@数据@@@@技术@@为基于证据的未来@@趋势预测提供了一@@种可能@@,但同时@@有可能会带来公平和@@公正的问题@@。Michael Milakovich指出@@,在@@政务@@大@@数据@@@@@@应用中@@,数据@@挖掘阶段最有可能引发对公民隐私权的侵害@@。[16]尽管作为一@@种提升公共服务@@传递的重要手段@@,数据@@挖掘本身的意图@@是好的@@,但由政府@@收集和@@分析个@@人数据@@@@,不可避免@@地会引发对公民自@@由问题的争论@@。很多民众正在@@失去对政府@@的信任@@,其中部分原因就是政府@@机构拥有太多对公民个@@人数据@@的获取@@手段@@,而相反对个@@人数据@@的保护手段却太少@@。另外一@@个@@政务@@大@@数据@@@@@@应用的障碍来自@@伦理上的挑战@@,数据@@“可被获取@@@@,并不代表使用它就是道德的@@”[25]。大@@数据@@@@技术@@为基于证据的未来@@趋势预测提供了一@@种可能@@,使得社会科学的研究@@可以做到@@像自@@然科学研究一@@样的精准@@、量化@@、客观@@。大@@数据@@@@可以用于预测未来@@@@,人们可以基于大@@数据@@@@构建政策制定的概率模型@@,分析未来@@可能会发生什么@@,但这些模型会带来公平和@@公正的问题@@。举例来说@@,通过应用大@@数据@@@@技术@@@@,我们可以识别一@@些犯罪的@@“热点@@”区域@@,政府@@就可以在@@犯罪发生之前更好预知其发生规律@@,而生活@@在@@这些区域@@的人将会因此@@而比其他地方的人面临更高的被逮捕率@@。[26]
 
  (三@@)警惕互联网@@公司侵害国家数据@@主权@@
 
  由于@@中国数据@@产权的立法滞后@@,且在@@国家层面缺乏采集相关数据@@资源的统一@@规划@@,使得当前@@与国家经济@@、政治密切关联的数据@@较少掌握在@@政府@@手中@@,而如阿里@@、百度@@、腾讯@@、小米等@@互联网@@公司所掌握的数据@@资源较为丰富@@,且与国家经济社会运行关系密切@@。以阿里为例@@,已将数据@@化作为该公司三@@大@@战略之一@@@@,其所掌握的大@@数据@@@@资源与中国国家安全之间的关联@@,是建立在@@阿里的数据@@覆盖面和@@数据@@累积深度的基础之上的@@。目前@@,阿里旗下淘宝的注册用户就接近@@5亿@@,从@@而支撑起阿里的消费者数据@@@@、制造业数据@@和@@供应商数据@@@@。至@@2013年@@底@@,阿里旗下的支付宝实名用户已近@@3亿@@(其注册账户早在@@@@2012年@@底@@即@@已突破@@8亿@@),并成为@@全球最大@@的移动支付商@@;而截至@@@@2014年@@6月@@30日@@,创立仅一@@年@@的余额宝用户已超过一@@亿@@@@,差不多是股市开市@@20多年@@后中国股民的两倍@@,支付宝和@@余额宝共同支撑起阿里的金融数据@@@@。马云说其未来@@进军的领域是医疗@@和@@文化@@事业@@,届时又会形成阿里关于中国人的体质健康生理数据@@和@@心理意识数据@@@@。这些数据@@通过云计算进行挖掘之后@@,对国家安全的价值会远远超出国家保密局所保密的信息价值@@。[27]为此@@,推进政务@@大@@数据@@@@@@应用@@,必须要警惕互联网@@公司对国家数据@@主权的侵害@@。
 
  六@@、结语@@
 
  Gang-Hoon Kim等@@指出@@@@,国家主导是政务@@大@@数据@@@@@@发展的根本动力@@。[5]发达国家政府@@的大@@数据@@@@项目都有着相似的目标导向@@(如公共服务@@的平等@@性和@@可获取@@性@@、公众对公共事务的更好参与@@、透明性政府@@等@@等@@@@)。政务@@大@@数据@@@@@@应用发展的主要关注@@点集中在@@安全性@@、速度@@、互操作性@@、分析能力和@@竞争人才等@@方面@@。当然@@,每个@@国家的政府@@都有其优先主导的方向@@,以及基于自@@身特殊环境的机遇与挑战@@(如美国@@的恐怖主义和@@健康问题@@,日@@本@@的自@@然灾害@@,以及韩国@@的国防事业等@@等@@@@)。[28]
 
  中国在@@推进政务@@大@@数据@@@@@@应用@@的过程中@@,应从@@中国实际出发@@,出台切实可行的政府@@大@@数据@@@@发展供给政策@@。
 
  参考文献略@@。
 
  基金项目@@:国家发展改革委重大@@问题软科学研究项目@@“大@@数据@@@@与重大@@政策评估研究@@”。
 
  作者简介@@:
 
  于施洋@@(1974—),男@@,博士@@,副研究员@@,国家信息中心信息化研究部副主任@@,国家发改委@@互联网@@大@@数据@@@@分析中心@@执行副主任@@,研究方向@@:信息化战略@@、电子政务@@规划@@。
 
  王建冬@@(1982—),男@@,博士@@,副研究员@@,国家信息中心信息化研究部大@@数据@@@@分析处副处长@@,国家发改委@@互联网@@大@@数据@@@@分析中心@@主任助理@@,研究方向@@:网络用户行为与政府@@信息服务@@创新@@@@。
 
  童楠楠@@(1989—),女@@,中国人民大@@学信息资源管理@@学院博士@@研究生@@,国家信息中心信息化研究部助理研究员@@,国家发改委@@互联网@@大@@数据@@@@分析中心@@合作交流部主任@@,研究方向@@:政府@@信息服务@@创新@@。
责任编辑@@:admin