大@@数据@@@@的广泛应用及其背后蕴藏的巨大@@潜力和@@价值@@,使得其成为了国家重要的战略资源@@。积极推动@@“大@@数据@@@@”的建设@@,促进政务@@大@@数据@@@@@@的发展已是必然@@。但是在政务@@大@@数据@@@@@@的建设@@过程中@@,还需要避免@@这三个@@误区@@:

 
  1、大@@数据@@@@不等同于开放数据@@@@
 
  由于目前尚无对@@“大@@数据@@@@”的标准界定@@,因此在大@@多人将开放数据@@等同于大@@数据@@@@@@,将任何@@“大@@”的政府@@数据@@集的发布都当作是大@@数据@@@@@@。但事实上@@,很多开放数据@@只是离散的@@“小数据@@@@”,并不具备大@@规模@@、未经处理和@@非结构化等大@@数据@@@@的基本特征@@,且很多通过开放数据@@机构发布的在线数据@@集仅仅是一个@@可用的样本集@@。
 
  同时@@,虽然开放数据@@对于促进政务@@大@@数据@@@@@@应用意义很大@@@@,但当开放数据@@仅仅是由于上级部门的指令要求@@,并对政府@@部门本身工作并没有任何回馈时@@,开放数据@@项目就会缺乏可持续性@@。考虑到@@开放数据@@并不是不需要成本@@(公务员需要花时间去收集这些数据@@@@,并发布出去@@),在政府@@看不到@@任何收益的情况下@@,将其维持下去会很困难@@。
 
  在加拿大@@和@@英国@@@@,已经有证据表明@@,政府@@开放数据@@项目的可持续性受到@@了威胁@@,有些官员将开放数据@@描述为仅是由一小群爱好者推动的@@“桌角项目@@”。以美国的@@data.gov门户网站为例@@,其在@@2012年@@包含有@@378529个@@原始空间@@数据@@集@@、1264个@@政府@@@@APP和@@236个@@公民开发@@APP。然而@@,到@@2014年@@,该网站的数据@@集事实上已经下降到@@了@@108606个@@,且各种@@APP的数量也有所下降@@。这实际上也是因为网站数据@@集的可用性不佳造成的@@。
 
  此外@@,为了便于开发者和@@分析者能够不受数据@@格式限制而处理数据@@@@,开放数据@@集都是以原始格式发布的@@,这将影响数据@@的获得和@@使用@@。由于编码缺乏一致性@@,这些数据@@在没有电脑归纳的情况下非常难以理解@@,从而难以得到@@真正有效应用@@。可见@@,在推动政务@@大@@数据@@@@@@应用中@@,不能简单地将大@@数据@@@@等同于开放数据@@@@。
 
  2、大@@数据@@@@不等同于共享数据@@@@
 
  Gang-Hoon Kim等对美国@@、英国@@、荷兰@@、瑞士@@、新加坡@@、日本@@、韩国@@、澳大@@利亚等发达国家的@@24项政府@@大@@数据@@@@应用进行了统计分析@@,发现目前发达国家政府@@大@@数据@@@@应用与商业领域大@@数据@@@@应用相比@@,规模还有很大@@距离@@;且目前大@@部分政府@@大@@数据@@@@应用的对象仍以结构化数据@@为主@@,较少采用实时@@、动态@@、半结构化甚至非结构化数据@@@@。这在中国政务@@大@@数据@@@@@@应用中也较为常见@@。
 
  据调查@@,目前很多地方政府@@建设的大@@数据@@@@平台@@@@,仅仅是过去政府@@共享数据@@平台@@的@@“翻版@@”。政府@@推动大@@数据@@@@平台@@建设的首要目的不是推动大@@数据@@@@应用@@,而是统一政府@@信息基础设施@@,实现各部门数据@@的互联互通@@。然而@@,政府@@大@@数据@@@@不仅仅是政府@@自身的业务数据@@@@,在当今社会@@,有大@@量对政府@@治理有意义的大@@数据@@@@源@@,如金融@@、电商@@、医疗@@、社交媒体等@@,并不完全由政府@@自身掌握@@。
 
  在推动政务@@大@@数据@@@@@@应用中@@,应逐步整合政府@@外部数据@@资源@@,建设国家层面的全国性大@@数据@@@@中心@@,形成更加完善的治理决策支持体系@@,以在数据@@整合的基础上实现服务@@整合@@。以澳大@@利亚@@Centrelink国家数据@@中心的建设@@为例@@,全国各地的@@Centrelink与数据@@中心直接联网@@,联邦@@、州@@、当地的服务@@机构@@,如税务部门@@、金融机构@@、警局等@@,也与数据@@中心实现联网共享@@;Centrelink在多种服务@@渠道的后台@@,借助信息通信技术将业务流程@@、服务@@、网络和@@资源进行优化整合@@,便捷@@、高效地为公众提供一体化的服务@@@@。
 
  3、大@@数据@@@@不是等同于海量数据@@@@
 
  随着大@@数据@@@@在中国的不断发展@@,各个@@地方都开始兴建大@@数据@@@@中心@@,但对于大@@数据@@@@中心的建设@@@@,更多@@地还停留在@@“建机房@@、上设备@@、堆数据@@@@”的阶段@@,忽视了大@@数据@@@@强调的是对数据@@的分析和@@应用@@。
 
  对于政务@@大@@数据@@@@@@的推进或大@@数据@@@@中心的建设@@@@,首先应有周密@@、严谨@@、细致的数据@@目录体系顶层规划@@,建立统一的数据@@资源目录体系@@、数据@@标准体系@@、数据@@质量审计体系和@@业务系统数据@@共享交换体系等@@;其次@@要有可对比@@、可回溯@@、可审计的数据@@质量管理体系@@,保障数据@@采集获取的可持续性@@,避免@@“数据@@陷阱@@”;再者@@,要有精通数据@@挖掘和@@业务建模的数据@@科学家队伍@@,从政务@@应用需求出发@@,做好潜在数据@@价值的挖掘与应用@@。
 
  此外@@,当前不少学者还未真正认识到@@大@@数据@@@@价值@@,认为@@海量数据@@无法获得@@,且大@@数据@@@@只是一种暂时性趋势@@。殊不知@@,大@@数据@@@@虽指海量数据@@@@,但并不是@@“全数据@@@@”,而是数据@@资源总量不断增长的状态@@,且从@@“大@@数据@@@@”中挖掘出有价值信息才是大@@数据@@@@应用的关键@@。
 
  著名的管理和@@咨询@@公司麦肯锡@@(McKinsey)认为@@,“大@@数据@@@@已经渗透到@@工业和@@商业领域的各个@@方面@@,成为影响生产的一个@@重要因素@@”!这一点不可否认@@,而且这种影响会随着大@@数据@@@@应用的加深而逐渐扩大@@@@。所以正确的认知政务@@大@@数据@@@@@@@@,快速促进其发展@@,才能缩短我国与发达国家之间的差距@@!
责任编辑@@:admin