原标题@@:政务@@大@@数据@@@@@@有雷区@@,政府@@请想清楚这几件事@@——

  近年@@来@@,大@@数据@@@@在全球范围内受到@@追捧@@。大@@数据@@@@已经渗透到@@工业和@@商业领域的各个@@方面@@,成为@@影响生产的一个@@重要因素@@,大@@数据@@@@的应用涉及经济@@、文化@@、教育@@、医疗@@、公共管理等各行各业@@。正是由于大@@数据@@@@的广泛应用及其背后蕴藏的巨大@@潜力和@@价值@@,许多国家纷纷将@@“大@@数据@@@@”的建设和@@发展上升为国家战略@@,积极推动大@@数据@@@@应用的发展@@。

 
  政务@@大@@数据@@@@@@需坚持的基本方向@@
 
  整体性政府@@@@
 
  整体性政府@@@@强调政府@@内部须实现机构@@、部门@@、专业@@、层级等之间的协调整合@@,以更好地解决公众需求@@,避免@@因政府@@内部矛盾冲突而造成的公共服务@@效率低下@@。单一数据@@源已越来越难以满足应对很多政策领域日@@益复杂问题的需求@@,未来@@将会出现越来越多跨数据@@集的联系@@,且在数字时代@@,政府@@治理的关键在于整合多数据@@源的公共管理模式@@,因此@@,推动政务@@大@@数据@@@@@@应用首先应坚持整体性政府@@@@方向@@,推动政府@@间的数据@@共享与业务协同@@。
 
  在英国@@@@,曾有报道称@@,由于缺乏跨部门@@沟通@@,当地警察部门@@和@@医院@@系统推进的一个@@分享@@暴力犯罪数据@@的项目最终宣告失败@@。相比商业机构而言@@,政府@@在推进大@@数据@@@@方面所面临的挑战更加尖锐@@,因为他们必须在遵从安全性和@@相关法规的前提下@@,不断打破部门@@孤岛来推进数据@@的集成@@。政府@@部门@@不仅要应对多数据@@源和@@不同格式数据@@的集成分析等大@@数据@@@@领域通行问题@@,还要面对很多政府@@部门@@特有的挑战和@@问题@@。
 
  但对推进政务@@大@@数据@@@@@@应用@@而言@@,无论是对政府@@自身监管行为所产生的大@@数据@@@@@@,还是对公民在社交媒体或其他网络平台@@上所产生的行为数据@@进行采集和@@分析@@,都可能促进政府@@机构中跨层级的@@“智能中心@@”的建立@@。
 
  如在美国@@@@“9·11事件@@”以后@@,借由国家安全之名@@,政府@@开始强力推进跨部门@@电子数据@@共享@@。如美国国土安全部高度强调跨部门@@数据@@的互操作性@@@@,并应用多种技术手段促进数据@@在市政部门@@@@、社区@@、医院@@、供血站@@、避难所等各类机构之间的顺畅流动@@。此外@@,美国在环保@@、交通@@、医疗@@和@@公共安全等领域的信息共享也取得了良好成效@@。
 
  透明化政府@@@@
 
  大@@数据@@@@分析技术的使用@@,能够大@@大@@提升政府@@服务@@的效能@@。大@@数据@@@@能够提升电子政府@@的效率和@@效果@@,并促进其进一步演化为透明政府@@@@,这被认为是电子政府@@的最终演化阶段@@。
 
  大@@数据@@@@应用建立在掌握数据@@的基础上@@,以海量数据@@为前提@@,政务@@大@@数据@@@@@@的发展往往离不开政府@@开放数据@@@@,这使得政府@@的透明度大@@大@@提高@@。纽约大@@学法学院教授贝丝@@·诺维克@@(Beth Novick)表示@@,数据@@的开放可以让政府@@公职人员和@@民众一起参与进来@@,解决政府@@无法完成的@@、棘手的问题@@,更广泛地发挥公众力量@@,借助大@@数据@@@@平台@@更好地进行社会管理@@。随着政府@@组织@@的行为及其与公众的交互越来越数据@@化@@,在政府@@自身内部系统中产生的各类大@@数据@@@@也为透明性政府@@建设提供了巨大@@潜力@@。
 
  在推进政务@@大@@数据@@@@@@应用@@中@@,政府@@的监管方式应不断创新@@,更加透明@@。在最极端的情况下@@,如果我们可以设想一个@@机构像维基百科那样完全进行数字化运作@@,那么通过下载其所有的编辑历史就可以提供该@@“组织@@”的所有完整的交互记录@@,从而提供了一种迄今为止难以想象的机会去理解其治理安排@@。随着政府@@组织@@越来越@@“成为@@”一种前台的网络存在和@@后台的信息处理系统@@,大@@数据@@@@也将更有力地促进上述整体性政府@@@@的最终形成@@。
 
  服务@@型政府@@@@
 
  大@@数据@@@@可以促进政府@@公共服务@@水平的提升@@,有利于服务@@型政府@@@@的建立@@@@。在大@@数据@@@@时代@@,公众可以更好地参与到@@政府@@工作之中@@,与政府@@分享@@信息@@,形成政府@@和@@公众共同参与的政务@@决策机制@@。社会公众可以通过社交媒体@@、公开出版物@@、博客等渠道分享@@他们的意见@@,大@@数据@@@@分析技术可以处理这些非结构化数据@@@@,并将更好的服务@@和@@方案传递给所需的客户群体@@。
 
  因此@@,在大@@数据@@@@背景下@@,任何政府@@都可以藉由政务@@大@@数据@@@@@@的采集@@、分析和@@利用@@,不断推动优化政府@@自身运作流程和@@服务@@效能@@。而且@@,政务@@大@@数据@@@@@@分析是政府@@理解公民行为@@、解释政策与公共服务@@优劣的良好手段@@,也是政府@@决策者理解公众需求与偏好的工具@@,以更好地理解人们对于公民参与的积极性@@,对立法变动的态度@@,以及对政府@@公共服务@@的需求@@。美国国税局@@(IRS)曾经重新设计其纳税申报流程@@,并应用大@@数据@@@@技术手段来提高对纳税欺诈和@@纳税不遵从行为的自动监测@@。
 
  在美国@@,随着联邦@@政府@@各个@@机构对于大@@数据@@@@分析的应用@@,政府@@在处理自身事务时将花费越来越少的精力@@。此外@@,大@@数据@@@@还可有效改进政府@@绩效管理方法@@,促进公共服务@@的提升@@。以往政府@@部门@@的绩效管理往往是滞后的@@,因为其主要依赖一些事后的指标来评估政府@@工作的效果@@。未来@@,政府@@管理部门@@应当更多@@依靠实时性数据@@来提升政府@@管理效能@@。
 
  政务@@大@@数据@@@@@@需避免@@的认识误区@@
 
  将大@@数据@@@@等同于开放数据@@@@
 
  由于目前@@尚无对@@“大@@数据@@@@”的标准界定@@,政府@@部门@@对大@@数据@@@@的认识存在混乱@@,有将开放数据@@等同于大@@数据@@@@@@,有将任何@@“大@@”的政府@@数据@@集的发布都当作是大@@数据@@@@@@。但事实上@@,很多开放数据@@只是离散的@@“小数据@@@@”,并不具备大@@规模@@、未经处理和@@非结构化等大@@数据@@@@的基本特征@@,且很多通过开放数据@@机构发布的在线数据@@集仅仅是一个@@可用的样本集@@。
 
  同时@@,虽然开放数据@@对于促进政务@@大@@数据@@@@@@应用意义很大@@@@,但当开放数据@@仅仅是由于上级部门@@的指令要求@@,并对政府@@部门@@本身工作并没有任何回馈时@@,开放数据@@项目就会缺乏可持续性@@。考虑到@@开放数据@@并不是不需要成本@@(公务员需要花时间去收集这些数据@@@@,并发布出去@@),在政府@@看不到@@任何收益的情况下@@,将其维持下去会很困难@@。
 
  在加拿大@@和@@英国@@@@,已经有证据表明@@,政府@@开放数据@@项目的可持续性受到@@了威胁@@,有些官员将开放数据@@描述为仅是由一小群爱好者推动的@@“桌角项目@@”。以美国的@@data。gov门户网站为例@@,其在@@2012年@@包含有@@378529个@@原始空间@@数据@@集@@、1264个@@政府@@@@APP和@@236个@@公民开发@@APP。然而@@,到@@2014年@@,该网站的数据@@集事实上已经下降到@@了@@108606个@@,且各种@@APP的数量也有所下降@@。这实际上也是因为网站数据@@集的可用性不佳造成的@@。
 
  此外@@,为了便于开发者和@@分析者能够不受数据@@格式限制而处理数据@@@@,开放数据@@集都是以原始格式发布的@@,这将影响数据@@的获得和@@使用@@。由于编码缺乏一致性@@,这些数据@@在没有电脑归纳的情况下非常难以理解@@,从而难以得到@@真正有效应用@@。可见@@,在推动政务@@大@@数据@@@@@@应用中@@,不能简单地将大@@数据@@@@等同于开放数据@@@@@@。
 
  将大@@数据@@@@等同于共享数据@@@@
 
  Gang-Hoon Kim等对美国@@、英国@@、荷兰@@、瑞士@@、新加坡@@、日@@本@@、韩国@@、澳大@@利亚等发达国家的@@24项政府@@大@@数据@@@@应用进行了统计分析@@,发现目前@@发达国家政府@@大@@数据@@@@应用与商业领域大@@数据@@@@应用相比@@,规模还有很大@@距离@@;且目前@@大@@部分政府@@大@@数据@@@@应用的对象仍以结构化数据@@为主@@,较少采用实时@@、动态@@、半结构化甚至@@非结构化数据@@@@。这在中国政务@@大@@数据@@@@@@应用中也较为常见@@。
 
  据调查@@,目前@@很多地方政府@@建设的大@@数据@@@@平台@@@@,仅仅是过去政府@@共享数据@@平台@@的@@“翻版@@”。政府@@推动大@@数据@@@@平台@@建设的首要目的不是推动大@@数据@@@@应用@@,而是统一政府@@信息基础设施@@,实现各部门@@数据@@的互联互通@@。然而@@,政府@@大@@数据@@@@不仅仅是政府@@自身的业务数据@@@@,在当今社会@@,有大@@量对政府@@治理有意义的大@@数据@@@@源@@,如金融@@、电商@@、医疗@@、社交媒体等@@,并不完全由政府@@自身掌握@@。
 
  在推动政务@@大@@数据@@@@@@应用中@@,应逐步整合政府@@外部数据@@资源@@,建设国家层面的全国性大@@数据@@@@中心@@,形成更加完善的治理决策支持体系@@,以在数据@@整合的基础上实现服务@@整合@@。以澳大@@利亚@@Centrelink国家数据@@中心的建设为例@@,全国各地的@@Centrelink与数据@@中心直接联网@@,联邦@@、州@@、当地的服务@@机构@@,如税务部门@@@@、金融机构@@、警局等@@,也与数据@@中心实现联网共享@@;Centrelink在多种服务@@渠道的后台@@,借助信息通信技术将业务流程@@、服务@@、网络和@@资源进行优化整合@@,便捷@@、高效地为公众提供一体化的服务@@@@。
 
  将大@@数据@@@@等同于海量数据@@@@
 
  随着大@@数据@@@@在中国的不断发展@@,各个@@地方都开始兴建大@@数据@@@@中心@@,但对于大@@数据@@@@中心的建设@@,更多@@地还停留在@@“建机房@@、上设备@@、堆数据@@@@”的阶段@@,忽视了大@@数据@@@@强调的是对数据@@的分析和@@应用@@。
 
  对于政务@@大@@数据@@@@@@的推进或大@@数据@@@@中心的建设@@,首先应有周密@@、严谨@@、细致的数据@@目录体系顶层规划@@,建立统一的数据@@资源目录体系@@、数据@@标准体系@@、数据@@质量审计体系和@@业务系统数据@@共享交换体系等@@;其次@@要有可对比@@、可回溯@@、可审计的数据@@质量管理体系@@,保障数据@@采集获取的可持续性@@,避免@@“数据@@陷阱@@”;再者@@,要有精通数据@@挖掘和@@业务建模的数据@@科学家队伍@@,从政务@@应用需求出发@@,做好潜在数据@@价值的挖掘与应用@@。
 
  此外@@,当前@@不少学者还未真正认识到@@大@@数据@@@@价值@@,认为海量数据@@无法获得@@,且大@@数据@@@@只是一种暂时性趋势@@。殊不知@@,大@@数据@@@@虽指海量数据@@@@,但并不是@@“全数据@@@@”,而是数据@@资源总量不断增长的状态@@,且从@@“大@@数据@@@@”中挖掘出有价值信息才是大@@数据@@@@应用的关键@@。
 
  政务@@大@@数据@@@@@@需警惕的潜在问题@@
 
  警惕数据@@权的恶意使用或过度滥用@@
 
  随着大@@数据@@@@应用的不断推进@@,数据@@开始被视为重要的战略资源@@,“世界经济论坛@@”报告曾指出大@@数据@@@@为新财富@@,价值堪比石油@@。在政治领域@@,数据@@的所有权是一种新的权利源泉@@。围绕原始数据@@的占有权和@@发布权的斗争将成为@@一个@@持久性的政治议题@@。一个@@不可否认的政治事实是@@,意识形态的倾向性总是会影响对客观@@事实的调查@@,并且对决策过程产生导向作用@@。
 
  当前@@,数据@@权被滥用的案例普遍存在@@。如针对政府@@网站@@数据@@不准确问题@@,2001年@@美国政府@@颁布了@@《数据@@质量条例@@》(Data Quality Act),允许私人团体对联邦@@政府@@部门@@所发布信息的准确性提出质疑@@。很多反对美国环保政策的商业团队就经常利用这一条款来拖延环保监管工作的执行@@。这条法律变成了环境保护监管工作的一个@@巨大@@障碍@@,因为它经常被用来拖延那些必要的监管工作的正常开展@@。在推进政务@@大@@数据@@@@@@应用@@中@@,应警惕数据@@权的恶意使用或过度使用@@。
 
  警惕大@@数据@@@@带来的信息歧视@@
 
  大@@数据@@@@技术为基于证据的未来@@趋势预测提供了一种可能@@,但同时@@有可能会带来公平和@@公正的问题@@。在政务@@大@@数据@@@@@@应用中@@,数据@@挖掘阶段最有可能引发对公民隐私权的侵害@@。尽管作为一种提升公共服务@@传递的重要手段@@,数据@@挖掘本身的意图是好的@@,但由政府@@收集和@@分析个@@人数据@@@@,不可避免@@地会引发对公民自由问题的争论@@。很多民众正在失去对政府@@的信任@@,其中部分原因就是政府@@机构拥有太多对公民个@@人数据@@的获取手段@@,而相反对个@@人数据@@的保护手段却太少@@。
 
  另外一个@@政务@@大@@数据@@@@@@应用的障碍来自伦理上的挑战@@,数据@@“可被获取@@,并不代表使用它就是道德的@@”。大@@数据@@@@技术为基于证据的未来@@趋势预测提供了一种可能@@,使得社会科学的研究可以做到@@像自然科学研究一样的精准@@、量化@@、客观@@。大@@数据@@@@可以用于预测未来@@@@,人们可以基于大@@数据@@@@构建政策制定的概率模型@@,分析未来@@可能会发生什么@@,但这些模型会带来公平和@@公正的问题@@。
 
  举例来说@@,通过应用大@@数据@@@@技术@@,我们可以识别一些犯罪的@@“热点@@”区域@@,政府@@就可以在犯罪发生之前更好预知其发生规律@@,而生活在这些区域@@的人将会因此@@而比其他地方的人面临更高的被逮捕率@@。
 
  警惕互联网@@公司侵害国家数据@@主权@@
 
  由于中国数据@@产权的立法滞后@@,且在国家层面缺乏采集相关数据@@资源的统一规划@@,使得当前@@与国家经济@@、政治密切关联的数据@@较少掌握在政府@@手中@@,而如阿里@@、百度@@、腾讯@@、小米等互联网@@公司所掌握的数据@@资源较为丰富@@,且与国家经济社会运行关系密切@@。
 
  以阿里为例@@,已将数据@@化作为该公司三大@@战略之一@@,其所掌握的大@@数据@@@@资源与中国国家安全之间的关联@@,是建立在阿里的数据@@覆盖面和@@数据@@累积深度的基础之上的@@。目前@@,阿里旗下淘宝的注册用户就接近@@5亿@@,从而支撑起阿里的消费者数据@@@@、制造业数据@@和@@供应商数据@@@@。至@@2013年@@底@@,阿里旗下的支付宝实名用户已近@@3亿@@(其注册账户早在@@2012年@@底@@即已突破@@8亿@@),并成为@@全球最大@@的移动支付商@@;而截至@@@@2014年@@6月@@30日@@,创立仅一年@@的余额宝用户已超过一亿@@@@,差不多是股市开市@@20多年@@后中国股民的两倍@@,支付宝和@@余额宝共同支撑起阿里的金融数据@@@@。
 
  马云说其未来@@进军的领域是医疗@@和@@文化@@事业@@,届时又会形成阿里关于中国人的体质健康生理数据@@和@@心理意识数据@@@@。这些数据@@通过云计算进行挖掘之后@@,对国家安全的价值会远远超出国家保密局所保密的信息价值@@。为此@@,推进政务@@大@@数据@@@@@@应用@@,必须要警惕互联网@@公司对国家数据@@主权的侵害@@。
 
  结语@@
 
  国家主导是政务@@大@@数据@@@@@@发展的根本动力@@。发达国家政府@@的大@@数据@@@@项目都有着相似的目标导向@@(如公共服务@@的平等性和@@可获取性@@、公众对公共事务的更好参与@@、透明性政府@@等等@@)。政务@@大@@数据@@@@@@应用发展的主要关注@@点集中在安全性@@、速度@@、互操作性@@、分析能力和@@竞争人才等方面@@。
 
  当然@@,每个@@国家的政府@@都有其优先主导的方向@@,以及基于自身特殊环境的机遇与挑战@@(如美国的恐怖主义和@@健康问题@@,日@@本@@的自然灾害@@,以及韩国@@的国防事业等等@@)。中国在推进政务@@大@@数据@@@@@@应用@@的过程中@@,应从中国实际出发@@,出台切实可行的政府@@大@@数据@@@@发展供给政策@@。
责任编辑@@:admin