2014年@@两会期间@@,中央电视台新闻联播设立了@@《两会大@@数据@@@@@@》板块@@,每天通过政府@@工作报告相关主题和议论特点进行大@@数据@@@@分析@@@@,给出不同形式@@、不同内容的关注@@度以@@及经济社会发展预测等具体生动的分析@@图表@@,令人耳目一新@@。“大@@数据@@@@”也随之登上热词榜@@。那么@@,到底什么是大@@数据@@@@@@,它又有@@何价值呢@@?

  大@@数据@@@@有@@多大@@@@

  在当今信息网络时代@@,人们的网上操作@@,平时的一举一动@@,机器的运转活动@@,大@@自然的随时变化都会产生许许多多的数据@@@@@@。这些数据@@量大@@且复杂@@,用现有@@的计算工具难以@@处理@@,人们形象地称之为@@“大@@数据@@@@”。

  我们来看看@@这些@@:互联网@@一天产生的全部内容可以@@刻满@@1.68亿@@张@@DVD;每天通过网络传输的电子邮件达@@2000多亿@@封@@,发出的社区帖子达@@200万个@@,卖出的手机为@@37.8万台@@;腾讯公司注册用户超过@@7亿@@,同时@@在线人数超过@@1亿@@;创建@@“平安城市@@”,一个摄像头运行一小时@@,产生的数据@@@@是@@3.6G;医院检查一次@@@@CT产生几个@@G的影像数据@@@@;在数字化工业设计的今天@@,设计一架飞机@@,几十万个@@零部件的尺寸@@、大@@小@@、形状均是数据@@@@;我们每个人每天打电话@@、刷卡支付@@,会产生很多数据@@@@;想象一下这些数据@@会是多么庞大@@@@?IBM的研究称@@,整个人类文明所获得的全部数据@@中@@,有@@90%是过去两年@@内产生的@@。而到了@@2020年@@,全世界所产生的数据@@@@规模将达到今天的@@44倍@@。大@@数据@@@@具有@@数据@@量大@@@@、类型繁多@@、数据@@变化快@@、价值密度低等四个典型特征@@,传统处理方法和软件工具已不能分析@@处理这些大@@量的数据@@@@@@,需要创新数据@@处理方法和软件分析@@工具@@。

  产生这么@@多的数据@@@@不难理解@@。从智能手机的普及到二维码@@的流行@@,再到可穿戴设备的面世@@,我们的衣食住行基本都可以@@电子化了@@,海量的数据@@@@也随之而来@@;工业设备@@、汽车@@、电表上无数传感器@@,随时测量和传递着各种各样的信息@@,都会产生海量的数据@@@@@@;不断成熟的手机指纹识别传感器@@、嗅觉传感器甚至可以@@感知情绪的新技术接踵而至@@,这一切使得人类活动以@@及物理世界数据@@化变为可能@@。

  这么@@“大@@”的数据@@@@,如何存放呢@@?当然@@,这得益于科技的发展@@:反映计算机硬件技术进步的摩尔定律是这样描述的@@——大@@约每隔@@18个月@@集成电路的集成度增加一倍@@@@,而价格下降一半@@。成本的不断下降促进了大@@数据@@@@的可存储性@@。同时@@,随着量子计算@@、光计算等新型介质研究与应用发展@@,数据@@存储能力将进一步大@@幅提升@@。

  大@@数据@@@@的价值@@

  如果你是亚马逊的会员@@,你可能早都发现@@“猜你喜欢@@”推荐的书常常是你感兴趣的@@;如果近期你打算网购一套空气净化设备@@,并在网上了解过相关信息@@,你会发现你的淘宝@@首页@@@@,有@@很多销售空气净化机的推送@@,甚至上其他网站@@,都会时不时弹出有@@关空气净化机的商品信息@@。

  这些都归功于商家对@@“大@@数据@@@@”的开发应用@@。他们依靠计算机进行数据@@处理@@,根据你的浏览@@、搜索@@、购物记录等等@@,“猜测@@”出你的喜好@@,从而帮你选择可能会喜欢@@、可能会购买的商品@@。看看@@“百度@@”“微信@@”“淘宝@@”这些我们工作生活离不开的应用吧@@:百度@@数据@@是需求数据@@@@,需要什么搜索@@什么@@;腾讯微信@@反映出的是兴趣和关系数据@@@@,而淘宝@@网数据@@形成交易数据@@@@,如果同时@@掌握兴趣和关系@@、需求及交易数据@@@@,就能够把一个人的行为搞清楚@@。同样的道理@@,各行各业只要数据@@足够@@“大@@”,预见未来@@似乎也并不难@@。

  有@@人说@@“预见未来@@”是大@@数据@@@@的核心价值@@。那么@@,这种预见未来@@的价值@@,能为我们的生活带来哪些改变呢@@?

  以@@“百度@@迁徙@@”为例@@。1月@@26日@@,“百度@@迁徙@@”网站正式上线@@。网站主页的中国地图上@@,每一个跳跃的点@@,都是人们出发和到达的目的地@@。点击任一城市@@,就会出现过往@@8小时内这一城市迁出与迁入人次@@最多的数据@@@@@@。“百度@@迁徙@@”就是把手机网民的定位信息汇总成大@@数据@@@@进行分析@@@@,从而勾勒出人们的迁徙轨迹@@。这些信息对分析@@人口迁移的方向@@、城镇化进程@@、春运运输调配等方面有@@着重要的价值@@。[page]

  毋庸置疑@@,对大@@数据@@@@的利用可以@@提升政府@@等管理部门的社会管理水平@@,例如@@对车辆运行数据@@的分析@@利用@@,可以@@使城市规划更加科学@@;流感高发季节@@,对疾病到来提前预测@@;旅游旺季@@,对热门景区高峰期游客数量提前预测@@,可以@@提升社会服务水平等等@@。

  一项对国际大@@公司的数据@@@@应用研究表明@@:数据@@的使用率提升@@10%,零售业的效率将提升@@49%,咨询@@服务业提升@@39%,航空@@、食品加工@@、建筑@@、钢铁@@、汽车@@、出版@@、基础设施等行业都能提升@@20%左右@@。数据@@的巨大@@价值由此可见一斑@@。

  当然@@,数据@@只是一堆冰冷的数字而已@@。大@@数据@@@@的价值@@是隐藏在数据@@之内的@@,要经过整合@@、分析@@、挖掘之后才会显现@@。同时@@,大@@数据@@@@的价值@@也是难以@@评估的@@。例如@@,现在看来没有@@任何价值的数据@@@@@@,可能以@@后会有@@价值@@;单个的数据@@@@没有@@价值@@,长时间的累积可能价值巨大@@@@;在一件业务中看似没有@@价值的数据@@@@@@,可能在另外的业务中会有@@大@@价值@@。因此@@,要不断提升大@@数据@@@@分析@@的方法和工具@@。数据@@再多@@,没有@@很好的整合和挖掘@@,其价值就不能得到体现@@。

   刚刚起步的大@@数据@@@@@@

  大@@数据@@@@的研究应用和产业形态已引发国际国内广泛关注@@@@。2012年@@,奥巴马政府@@宣布推出@@“大@@数据@@@@的研究和发展计划@@”,将投资两亿@@多美元@@,推动和改善大@@数据@@@@的收集@@、组织和分析@@技术@@,这标志着大@@数据@@@@从商业行为上升到国家战略层面@@。IBM、甲骨文@@、微软等跨国@@IT巨头也纷纷发布大@@数据@@@@战略@@,对大@@数据@@@@产品进行全面布局@@。在我国@@,科技部已经批准大@@数据@@@@重大@@基础研究项目@@,并将大@@数据@@@@作为国家未来重点发展的重大@@科技任务之一@@。工业与信息化部在@@“工业与信息化深度融合专项行动计划@@”中提出重视工业大@@数据@@@@的应用@@;电信@@、联通@@、移动三大@@运营商以@@及众多@@IT企业也积极开拓大@@数据@@@@市场@@。2014年@@春节期间的人口迁徙大@@数据@@@@分析@@@@、“两会大@@数据@@@@@@”就是大@@数据@@@@应用的生动实例@@。陕西省也把大@@数据@@@@作为战略性新兴产业重点发展方向之一@@,大@@力推动大@@数据@@@@应用基础研究和产业园区发展@@。

  国际国内对大@@数据@@@@的广泛关注@@已呈现出一个良好的开始@@。迎接大@@数据@@@@时代@@,与之相关的很多问题还需要科研人员奋力攻关@@。如何对复杂的大@@数据@@@@快速完成价值@@“提纯@@”,是亟待解决的难题@@。与此同时@@@@,如何保证数据@@的完整性和真实性@@、数据@@的共享@@,如何解决大@@数据@@@@所带来的安全和隐私以@@及计算机系统硬件与软件适应大@@数据@@@@特点等挑战@@,都是随着@@“大@@数据@@@@”的到来要必须面对的@@。此外@@,采集@@、存贮和发掘大@@数据@@@@需要较大@@人力和经费投入@@,如何得到良好的回报率@@,也将是影响大@@数据@@@@发展的重要因素@@。总之@@,大@@数据@@@@对我们的科学技术和数据@@驾驭能力提出了新的挑战@@。

  无论如何@@,大@@数据@@@@时代正在来临@@!

责任编辑@@:admin