“目前大@@数据@@@@的应用水平仍处于低位水平@@,数据@@开放共享进展滞后@@,大@@数据@@@@的活力还未得到充分释放@@。现在@@80%的数据@@掌握在政府手中@@,很多人在呼吁政府开放共享数据@@@@,这样才能让数据@@产生关联聚合产生更大@@的价值@@。”

  “大@@家以为数学家都像陈景润一样@@,边走路边思考数学问题@@,然后撞电线杆上了@@,其实不是@@。”2月@@8日下午@@,中国科学院院士@@、数学家徐宗本@@出席南都@@报系@@2017年@@总结表彰会暨南都@@大@@数据@@@@研究院揭牌仪式@@,现场分享@@了题为@@《再论大@@数据@@@@@@》的主题演讲@@。

  “画面中看似混杂无序的小碎片@@,经过成倍数据@@的叠加@@,最后@@形成一张大@@象的图像@@。当数据@@达到量变和质变的临界点时@@,人们可以清晰看到数据@@背后的故事@@,这就是大@@数据@@@@@@。而数据@@如果不相关联和分析@@,就无法创造更大@@的价值@@,好比有人只看到大@@象的鼻子@@,有人只琢磨大@@象的尾巴@@@@,但是怎么也看不到大@@象的整体@@。”围绕大@@数据@@@@原理@@@@,与其它信息技术的关系及盈利模式等问题@@,徐宗本@@借形象比喻与案例@@,将原本深奥的内容生动化@@。在他看来@@,目前国内大@@数据@@@@产业链条存在缺乏健壮性@@、完整性的问题@@。在国家大@@数据@@@@战略推动下@@,各地建立数据@@中心的积极性非常高@@。但在大@@数据@@@@产业价值链上@@,存储只是一部分@@,如果缺乏分析挖掘能力@@,并形成数据@@产品@@,就好比只买米不做饭@@。

  徐宗本@@总结@@,做大@@数据@@@@首先@@要明确目标@@,“数据@@是基础@@,平台@@是支撑@@,分析是核心@@,赚钱是王道@@。于大@@数据@@@@产业而言@@,数据@@就是基本的生产资料@@,而平台@@为收集存储数据@@提供支撑@@,最为核心的是分析@@,通过对数据@@的具体加工解决实际问题@@,进而变现创造价值@@。”

  谈大@@数据@@@@产业@@

  国内大@@数据@@@@产业处在初步阶段红利未得到充分释放@@

  南都@@:人们常有一个疑惑@@,多少数量级的数据@@才能被定义为@@“大@@数据@@@@”?

  徐宗本@@:大@@数据@@@@需要有很大@@空间@@才能存储@@,如果这样理解大@@数据@@@@@@,就是比较低级的认识@@。首先@@,我们需要认清几个概念@@。资料是指记录日常生活@@、经营@@、管理@@、生产过程的载体@@,比如一张报告@@,一份视频等@@。如果这些资料放在计算机上@@,那就是数据@@@@。数据@@是资料的数字化@@,以编码形成存在的信息载体@@。大@@数据@@@@则是大@@而复杂的数据@@@@,具有海量性@@、时变性@@、异构性@@、分布性的特征@@。数据@@从量变到质变会产生一个临界点@@,严格上超过这个临界点才达到@@“大@@”的含义@@,所以@@大@@数据@@@@是个相对概念@@,与特定的决策问题相关联@@。

  南都@@:在你看来@@,目前国内大@@数据@@@@产业发展处于什么阶段@@?

  徐宗本@@:与国外相比@@,我认为基本处于同一水平@@。现在@@大@@数据@@@@上升为国家战略@@,政府在积极推动@@,这是一个制度优势@@。同时@@,我们还有一个天然优势@@,就是人多市场大@@@@,数据@@资源丰富@@,而且@@目前国内互联网发展也走在前头@@。但总体而言@@,大@@数据@@@@产业还处在初步阶段@@。产业链条缺乏健壮性和完整性@@,未支持形成稳定的价值链@@。数据@@开放共享发展也较为落后@@,大@@数据@@@@的红利未得到充分释放@@。此外@@,地方政府还只满足于规划和战略层面@@,尚未具体落实@@。更重要的是对需求的认知模糊@@。企业的大@@数据@@@@盈利模式并不清晰@@,核心技术也有待突破@@。最后@@一些政策法规跟进不及时@@,数据@@垄断@@、数据@@安全事件多发@@。对于大@@数据@@@@产业@@,人们在观望@@,也存在盲目性@@。

  谈大@@数据@@@@价值@@

  数据@@只存储不分析变不了现创造价值关键在于模式@@

  南都@@:为什么大@@数据@@@@能产生价值@@?

  徐宗本@@:我认为与四个大@@数据@@@@原理@@有关@@。首先@@是量变质变原理@@@@,积累的数据@@量足够充分后@@,可以解决具体问题@@。第二个是关联聚合原理@@@@,比如研究大@@象@@,如果一个人只盯着大@@象的鼻子@@、尾巴@@,你观察@@20年@@,积累再多数据@@@@,也不能反映原来的面貌@@。数据@@只有聚合才能产生价值@@,共享则能放大@@价值@@。另外@@还有@@“分析出价值@@”原理@@,目前各地建立了太多数据@@中心@@,甚至出现产能过剩的问题@@。如果数据@@只存储不加以分析@@,则变不了现@@。最后@@,数据@@本身拥有的可复制@@、可重用@@、可加工的特点@@,使得数据@@的价值能够随着扩散的范围而增大@@@@。这就是效用倍增原理@@@@。

  南都@@:你曾提到大@@数据@@@@如果只存储不分析@@,就好比只买米不做饭@@,是这样吗@@?

  徐宗本@@:是的@@。大@@数据@@@@产业的本质在于分析数据@@@@。很多人不知道@@,这个比喻其实出自南方报业记者一篇报道@@。当时@@,我在广东参加一场活动@@,分享@@关于大@@数据@@@@的一些看法@@,记者用这个比喻做标题@@,解读得非常准确@@。这也是为什么你们一邀请我来参加活动@@,我就来了@@。因为我相信你们的水平@@。

  南都@@:大@@数据@@@@的盈利模式有哪些@@?

  徐宗本@@:很多人很关心大@@数据@@@@怎么赚钱@@。大@@数据@@@@产业链上@@,包括数据@@资源获取与管理@@@@;数据@@传输@@、存储和处理@@;数据@@分析@@、挖掘与理解@@;结合领域的大@@数据@@@@应用@@。基于价值链条的不同@@,可分为全链条模式和节点聚焦模式两种@@。前者关注聚焦全部环节@@,后者是做精中间产品@@,专注于某一环@@。第三种模式是垂直行业的合作共建模式@@,行业公司和技术公司合资成立公司@@,这样既可以保护数据@@源@@,又能增强服务@@。第四种模式是产研共生@@,一个公司和一个研究院合作@@,可保证产品质量的可持续性@@。最后@@是推动产业的平台@@模式@@,这种更适用于政府@@,由政府搭建平台@@提供公共服务@@,企业在其中孵化产品@@。其实大@@数据@@@@可以做很多事情@@,关键在于模式要对@@。

  谈大@@数据@@@@应用@@

  大@@数据@@@@带来思维的改变利用不同数据@@能提高效率服务@@

  南都@@:现在@@人工智能@@、物联网等技术发展迅速@@,人工智能的核心是大@@数据@@@@的分析@@,物联网的发展也离不开大@@数据@@@@@@。如何看待大@@数据@@@@的应用问题@@?

  徐宗本@@:现在@@大@@数据@@@@的实际应用案例已经不少@@,比如对医疗数据@@的应用@@,通过对大@@量的影像和病例数据@@分析@@@@,进而作出医疗诊断@@,有些技术水平已经达到能与医生相匹敌的程度@@。当然@@,目前大@@数据@@@@的应用水平仍处于低位水平@@,数据@@开放共享进展滞后@@,大@@数据@@@@的活力还未得到充分释放@@。现在@@80%的数据@@掌握在政府手中@@,很多人在呼吁政府开放共享数据@@@@,这样才能让数据@@产生关联聚合产生更大@@的价值@@。

  南都@@:在大@@数据@@@@应用过程中@@,一些企业有时并不知道自身需要什么样的数据@@@@,并且拿到数据@@后@@,也可能不清楚这个数据@@可实现多大@@价值@@。这是为什么@@?

  徐宗本@@:我觉得是缺乏大@@数据@@@@思维的原因@@。在我看来@@,大@@数据@@@@带来的是思维的改变@@,能够为我们提供社会科学方法论@@。现在@@企业做商业分析更多@@的还是基于业内数据@@分析@@@@。举个例子@@,比如我开了一家火锅店@@,目的是提高营业额@@。大@@数据@@@@怎么来帮忙呢@@?如果只是分析一天有多少顾客量@@,点了什么菜@@,消费额多少@@,这并不足为奇@@。需要注意的是@@,人们吃火锅跟天气@@、地域@@、小区周围有关@@。如果你收集和分析了天气数据@@@@、人口分布数据@@等@@,你就可以知道天马上冷了@@,人们想吃火锅了@@,哪里的人最喜欢吃麻辣火锅@@,店铺周围的小区住户是什么人@@,这样利用不同数据@@能够提高我们的效率和服务@@。

  谈数据@@安全@@

  必须采用技术手段保护用户隐私@@

  南都@@:数据@@流通才能创造价值@@。但数据@@流通过程中@@,可能涉及个人隐私和数据@@安全的问题@@?

  徐宗本@@:掌握大@@数据@@@@的政府部门@@、企业都负有不可推卸的责任@@,那就是必须采用技术手段@@,保护用户的隐私@@。比如将数据@@抽象化@@,进行脱敏和匿名化处理@@,同时@@还要承诺不能泄露和非法买卖数据@@@@。

  可以看到@@,现在@@公众对于个人隐私尤为关注@@。但另一方面@@,数据@@不流通不使用就无法创造价值@@,不要认为我所有的数据@@都不能让别人知道@@。举个例子@@,你的病例信息@@,谁来看比较好@@?如果大@@家都不提供病例信息@@,医生就无法通过大@@量医疗数据@@@@,发现疾病规律和作出预测@@。而且@@,在数据@@分析@@过程中@@,医生并不需要知道甲乙丙丁具体是谁@@。另外@@,还涉及到承诺和默契的问题@@。比如遇上妇产科医生是男的@@,产妇让不让他接生@@?所以@@,我认为企业应该主动担起保护责任@@,通过用户协议@@、隐私政策等方式@@,告诉用户是怎么收集和使用数据@@的@@,作出相应的承诺@@。

  南都@@:当被掌握的信息越来越多@@,一个直观的感受是针对你的营销越来越精准@@。如果有一天机器比你更了解你自己@@,这是一件值得担心的事吗@@?

  徐宗本@@:互联网或大@@数据@@@@来了以后@@,改变最大@@的是客户关系@@,客户在生产地位不一样@@,过去用户是上帝@@,现在@@叫做生产资料的一部分@@。随着数据@@的积累@@,机器对你的行为习惯@@、购买力@@、价值观爱好等@@,作出的预测当然@@会越来越精准@@,但不可能做到百分百@@。因为一旦意识到某个问题@@,人可以突然改变主意@@,就让你预测不出来@@。人和机器的不同在于@@,人可以产生意识@@、情感和顿悟@@。我认为不用担心@@,机器代替不了人@@。

责任编辑@@:qinpeng