小到敲击键盘@@、迈开步子@@,大到征信系统@@、政务@@记录@@,数据@@已成这个时代最活跃的要素和@@最有价值的@@“信息矿产@@”。无论@@“互联网@@+”、物联网还是智能制造@@,数据@@的触角几乎无远弗届@@,影响着几乎所有产业生态未来的走向@@。

 
  据中国信息通信研究院@@发布的@@《大数据@@白皮书@@(2016)》分析@@,未来五年@@,全球数据@@量将呈指数级增长@@。但庞大的总量却并不意味着完全有效的开发利用@@。《经济参考报@@》记者采访了解到@@,除了技术瓶颈外@@,开放和@@合作的障碍正在让大量数据@@陷入@@“沉睡@@”。数据@@原材料的缺乏与信息@@“孤岛@@”的形成@@,严重制约着大数据@@产业的发展@@。
 
  壁垒让数据@@@@“沉睡@@”
 
  国际数据@@公司@@(IDC)的数据@@显示@@,按目前发展趋势@@,预计@@2020年全球大数据@@总存储量将达到@@44ZB(1ZB约等于@@10000亿@@GB)。我国数据@@总量为@@909EB(1EB约等于@@1000亿@@GB),占全球数据@@总量的@@13%。
 
  目前数据@@层面的壁垒普遍存在于政企@@、企业间@@,业内人@@士表示针对现状普遍是通过购买和@@@@“爬虫@@”(自动获取网页内容的手段@@)的方式获取@@,但数据@@存在不准确@@、不全和@@非结构化等问题@@。
 
  “相比于行业@@间的数据@@流通@@,政企之间的壁垒更是一块沉睡@@数据@@的@@‘集聚地@@’。”中关村大数据@@产业联盟秘书长赵国栋说@@@@,“目前一些上市数据@@如股权占比@@、科研数据@@都是价值密度比较高的沉睡@@数据@@@@。”
 
  据中国信息通信研究院@@2015年对国内@@800多家企业的调研来看@@, 企业内部数据@@仍是大数据@@的主要来源@@@@。当前有@@32%的企业通过外部购买数据@@@@;只有@@18%的企业使用政府@@开放数据@@@@。
 
  业内人@@士指出@@,大数据@@时代的数据@@资源广泛散布于政府@@@@、行业@@、企业三个子系统中@@,其中@@,信息数据@@资源@@80%以上掌握在各级政府@@部门手里@@。而与此同时@@,区域部门间基本实现共享的省级地方仅占@@13%,区域部门间少量实现共享的地市和@@区县仅占@@32%和@@28%,信息共享和@@业务协同在地市和@@区县进展缓慢@@。
 
  “如果更多@@数据@@可以开放@@,将会对产业转型@@、政务@@和@@公共服务效率提升等大有裨益@@。”上海至信普林科技有限公司总经理顾敏洁说@@@@,“比如中国人@@民银行上海总部自@@2006年起公开金融信息后@@,催生了一批金融信息咨询@@服务公司@@,其中@@还有@@5家上市公司@@,拉动的就业人@@数也非常可观@@。”
 
  数据@@割据@@、技术壁垒和@@标准缺失@@形成数据@@孤岛@@@@
 
  “数据@@孤岛@@的成因主要有三个@@,数据@@割据@@、技术壁垒和@@标准缺失@@。”赵国栋说@@。观念问题是主观意愿缺失的症结@@。“政府@@部门由于缺乏企业间@@基于共同利益开发这样的主观能动性@@,导致数据@@开放滞后@@。除了政府@@部门@@,一些大企业也应该认识到数据@@合理开放可以造就更好的社会和@@行业@@生态价值@@。”
 
  外部管理规范@@、法规的缺失也使部分主体@@对开放数据@@保持顾虑@@。“目前如果只遵循@@‘谁的数据@@谁负责@@’这一简单的准则@@,要调动政府@@部门开放数据@@的积极性比较困难@@。”DT大数据@@产业创新研究院院长陈新河说@@@@。
 
  除了主观意愿@@,技术和@@标准也是一道@@“硬门槛@@”。“比如目前信息共享的安全问题@@。公共云的运维工作面临着一些新的安全风险和@@挑战@@。计算环境从本地到云端的自身安全性是提高了@@,但由于公共云的运维管理工作必须通过互联网@@完成@@,和@@传统@@IT环境运维有很大不同@@,容易造成管理员权限被劫持攻击@@,造成运维管理账号和@@凭证泄露等问题@@。”顾敏洁说@@。
 
  目前开放的数据@@同样因为格式标准缺失成了@@“开放的孤岛@@@@”。公布类似停车位数量@@、开放非标准化的图表等形式的数据@@都是不可机读的@@。这类@@“伪开放@@”并没有真正整合数据@@的价值@@。“不同行业@@数据@@整合必然需要标准化的数据@@格式@@,比如从卫生@@、人@@口的角度用数据@@对@@‘人@@’进行的描述就是不一样的@@。”全国信息安全标准化技术委员会大数据@@标准工作组成员张群说@@@@。
 
  “因此目前要开放的应该是底层数据@@@@,而不仅提供根据数据@@分析@@出来的结果或产品@@。”业内专家表示@@,这类@@数据@@在技术上应该有其标准形式@@,可以被计算机抓取@@、调用@@,而且在法律上也是可以进行各种使用的@@。
 
  开放整合数据@@需围绕应用场景@@
 
  要打通数据@@孤岛@@@@,一方面是技术上的革新和@@标准化的推进@@,同时包括数据@@安全领域建设@@。“在物联网时代@@,需要从政府@@等层面推进包括身份识别@@、信息安全系统等庞大的安全体系建设@@。”赵国栋说@@。
 
  “目前全国信息技术标准化技术委员会已推进获批了@@6项大数据@@领域的标准@@,包括了大数据@@技术参考模型@@、数据@@能力成熟度评价模型标准等@@。”张群说@@。
 
  另一方面@@,在法律维度@@,立法推进的前提是明确数据@@权属@@。对此@@,赵国栋建议@@,可以参照土地管理的做法@@,将数据@@权属划分为所有权@@、处置权@@、使用权和@@收益权@@。“例如处置权@@应归国家@@,规定归档@@、删除的各种条件等@@。只有@@权属清楚才能推动法律保护@@。”
 
  政府@@数据@@开放也并非一蹴而就@@,需要循序渐进@@。业内人@@士普遍认为@@,不涉及隐私和@@安全的数据@@可以率先开放@@,比如气象这类@@数据@@@@。同时政府@@部门和@@行业@@协会可以推动统一数据@@平台@@的建设@@,改变目前碎片化的现状@@。
 
  杭州市经信委云计算与大数据@@产业处处长黄左彦说@@:“杭州整合数据@@@@、搭建平台@@过程中的经验就是以项目为突破@@,目前类似@@‘5G’车联网项目@@、城市数据@@大脑等都是以交通为突破点@@。由政府@@主导政务@@数据@@开放共享@@,企业自带资金深度合作开发@@,其中@@包括数据@@交流@@。”
 
  “目前观念上有一个原则是被忽视的@@:即@@‘开放是常规@@,封闭才是例外@@’。”陈新河说@@,“政企间或者政府@@牵头整合数据@@仍应围绕应用场景@@、项目工程来@@,否则目前@@‘唤醒@@’的数据@@早晚也会重新@@‘落满灰尘@@’。”
责任编辑@@:admin