还有@@谁会比@@《大数据@@@@》一书的作者@@来谈大数据@@@@更合适呢@@?大数据@@@@时代@@作者@@维克托@@@@·迈尔@@·舍恩伯格@@近年来首次@@访华@@,在魔都献出他的来华首次@@演讲@@。在他看来@@,大数据@@@@的未来不用着急进行数据@@聚焦@@,及时做好数据@@搜索@@@@,转变数据@@运用理念@@,才是@@真正的利用大数据@@@@为自己所用的正确方式@@。

 
  以下是@@舍恩伯格@@演讲实录@@:
 
  非常荣幸能出席今天的盛会@@,今天上午我们听到了很多技术的演讲@@,技术实际上给我们带来了变革@@,这些变革也给我们带来了一些前所未有的成功@@,比如在商业界@@,还有@@各个@@公司@@,无论大公司还是@@小公司@@,都给他们带来了成功@@。在接下来的@@30分钟@@,我想让大家思考一下@@,数据@@实际上给我们带来了工具@@,而这些工具给我们带来了成功@@。但是@@@@我们要真正取得成功@@,还是@@要取决于我们利用这个@@工具的能力@@。这就需要我们要好好的了解什么是@@数据@@@@,还有@@未来的数据@@@@到底是@@怎么样的@@。
 
  首先我给大家讲一个@@有意思的故事吧@@@@。这个@@故事实际上是@@我的同事凯尔@@(音@@)所发现的@@。在美国的超市@@,很多年前他们销售一些蛋糕@@,这些蛋糕有不同的口味@@,巧克力味@@、香蕉味@@、桃子味@@……这个@@蛋糕的尺寸大概是@@@@30厘米那么大@@,就像一个@@馅饼一样@@。如果你问一下这些美国的超市@@,他们销售的这些蛋糕当中@@,哪款是@@最受欢迎的销量最好的@@,大家觉得是@@什么馅饼呢@@?答案是@@苹果馅饼@@。但是@@@@如果你要真正去问他们是@@不是@@真的喜欢苹果馅饼@@,实际上可能很多人并不是@@真的喜欢苹果馅饼@@。为什么他们不是@@最喜欢苹果馅饼@@,却买它呢@@?因为想一想@@,它有@@30厘米那么大@@,那全家买一个@@苹果派就够了@@。那家里的所有人可以达成一致@@,他们起码比较喜欢的就是@@苹果派@@,即使苹果派不是@@他们最喜欢吃的@@,但是@@@@他们可以吃@@,这个@@可以达成共识@@。因此很多年以来@@,世界上的这些超市@@,卖的派可能未必是@@人们最喜欢的口味@@,但是@@@@之后他们发现了问题所在@@,就是@@尺寸问题@@。如果你让它尺寸变小话@@,每一个@@家庭可以不止买一个@@派@@,每一个@@家庭成员都可以买一个@@自己喜欢吃的口味@@。如果你把尺寸变一下@@,他们可能就不是@@买苹果派@@,他们可以根据自己的口味买香蕉派@@、梨派@@、桃派@@,这个@@问题就很简单了@@。
 
  其实很多年以来@@,这些超市的策略是@@不对的@@。就是@@尺寸的问题@@,而不是@@口味的问题@@,他们的尺寸太大了@@。之后超市进行了调查@@,问用户到底喜欢吃什么口味的@@,用户肯定会说我想要吃苹果派@@,因为只有那个@@尺寸的苹果派@@。我们一直做数据@@研究@@,在观察周围的环境@@,但是@@@@几百年前几千年前@@,我们看当时的世界@@,也在搜集数据@@@@@@。搜集数据@@@@,分析数据@@@@,是@@需要花费很多的时间@@的@@,有时候也是@@非常困难的@@,它需要做大量的工作@@,有时候也是@@非常昂贵的@@。但是@@@@我们可能用到的数据@@@@只有一小部分@@,很有限@@,因此我们之前拥有的数据@@@@规模是@@非常小的@@。大家可以想一下@@,我们现在的数据@@@@分析@@,或者是@@一些小的样本@@。它们都是@@一些很小的数据@@@@@@。我们是@@把数据@@缩小到一定的规模@@,然后从这些小的规模数据@@上找到一些理论@@。当然了@@,那是@@小数据@@时代@@,也是@@我所成长的一个@@时代@@。
 
  但是@@@@现在一切都变了@@。我们现在搜集数据@@@@分析数据@@@@的能力越来越强了@@。而且现在搜集数据@@@@的成本也下降了@@。因此我们周围一切都变化了@@。那这时候我们就需要改变自己的思维@@,因为我们所处的是@@大数据@@@@时代@@@@。如果我们找到新的方法@@,就可以有新的理念@@。
 
  在过去@@我们希望可以利用数据@@@@,来回答问题@@,首先可能先是@@假设@@,这就是@@一个@@问题@@,然后搜集数据@@@@@@,最后进行分析@@@@,这就是@@一个@@流程@@。首先我们从问题切入@@。最后这个@@问题可能会给我们带来这个@@答案@@。那么这个@@问题@@,比如说大家最喜欢的口味的派是@@什么@@,是@@苹果还是@@桃味的@@?最后我们拿到了问题的答案@@,可能就是@@苹果派@@,我们就觉得苹果派是@@最受欢迎的@@,但是@@@@反而我们得到了这个@@问题的答案是@@错误的@@。
 
  现在我们其实可以做一些改变@@,改变一下我们的方式@@,我们不是@@从问题开始着手@@,因为有可能我们的问题本身就是@@错误的@@。我们先从数据@@着手@@,然后从数据@@开始搜集数据@@@@@@@@,进行分析@@。然后通过分析@@,我们可以提出一些非常棒@@的问题@@。比如说这个@@派的尺寸@@,最合适的尺寸是@@什么@@,这是@@正确的问题@@。根据这个@@分析@@,我们可以获得这样的一个@@假设@@。最后我们可以得到问题的答案@@,就是@@我们需要一个@@尺寸合适大小合适的派@@。我给大家拍张照片@@,后面的两位请微笑@@。好了@@,非常棒@@。现在我就要做一个@@决定@@,我拍了这个@@照片@@,什么是@@重要的@@,比如说如果你是@@非常重要的@@,我们就聚焦在你身上@@,后面的人就变成模糊的影像@@,我可能决定你是@@我的焦点@@@@,我不能让你成为一个@@模糊的影像@@。或者是@@我的焦点@@放在你这个@@人@@@@,那么你后面的人可能会变成模糊的影像@@,这意味着什么呢@@?
 
  我现在在照一个@@照片@@,我首先要清楚@@,我感兴趣的事物是@@什么@@,人是@@什么@@。我的焦点@@在哪里@@,我需要知道这个@@问题@@,知道了这个@@问题之后@@,我才能知道答案@@。但是@@@@如果我现在不知道焦点@@聚集在谁身上@@,那怎么办呢@@?实际上这个@@聚焦也是@@属于小数据@@@@,如果现在你现在已经决定了你聚焦在谁身上@@,这个@@就是@@小数据@@@@,如果现在还没有决定那怎么办呢@@@@?大家可以看这张照片@@,有一个@@牙刷@@,后面是@@我四岁的儿子@@,可以看到这里牙刷是@@我聚焦的位置@@,我儿子就变得模糊了@@。但是@@@@现在我想改变焦点@@@@,让我儿子成为焦点@@@@,那怎么办呢@@?那我们这张照片实际上是@@用大数据@@@@的摄象头来设想的@@,它实际上可以捕捉到各种各样的数据@@@@@@,现在我们想要让我的儿子变成焦点@@@@,我用这个@@大数据@@@@摄像机拍完了之后@@,就可以调节这个@@焦点@@@@,在牙刷和我儿子之间切换焦点@@@@,因为这个@@摄像机搜集到了所有的数据@@@@@@,不是@@小的数据@@@@@@,而是@@@@大的数据@@@@@@,因此我可以改变聚焦的位置@@。所以我们搜集所有的数据@@@@@@,不需要先定义问题@@,可以先把数据@@搜集起来@@,再聚焦问题是@@什么@@。也就是@@说@@如果你可以搜集到全面的数据@@@@的话@@,可以发现创新性的问题@@。而且你可能完全不需要回答这些问题@@。
 
  大家可能听说过这个@@品牌@@,多林国@@(音@@),实际上这是@@一个@@学习的应用@@,你可以用@@Iphone或是@@安卓系统来学习外国的语言@@。非常有意思@@,而且很酷@@。如果有兴趣的话@@,我也鼓励大家使用这个@@应用@@,全世界范围内有很多的人@@,每天都在使用多林国@@这个@@应用@@。我们使用数码设备@@,来使用这个@@应用@@,这个@@应用实际上可以捕捉我们的数据@@@@@@,捕捉我们的信息@@,可以捕捉我们学习语言的习惯@@,而且进行分析@@@@。多林国@@(音@@)这个@@公司@@,西班牙语的这些人@@,他们学习英语的方法是@@错误的@@,他们学习顺序是@@错误的@@,如果你可以改变一下这个@@顺序的话@@,西班牙人学习英语的速度@@就会越来越快@@。实际上他们一开始不是@@为了回答这个@@问题而搜集数据@@@@@@,他们先是@@搜集数据@@@@之后@@,然后分析数据@@@@@@,这个@@问题就出现了@@。他们通过分析@@,他们就调节了一下西班牙人学习英文的数据@@@@@@,帮助他们更好的学习英文@@,因此取得了成功@@。大学为什么不用这种方法呢@@?为什么我的教授同事们没有想到这一点@@呢@@?因为他们没有数据@@@@,而多林国@@@@(音@@)公司搜集到了这些数据@@@@。多林国@@(音@@)一开始并不知道怎么使用这些数据@@@@,但是@@@@他们逐渐逐渐的发现了可以如何应用这些数据@@@@,提升了用户的体验@@,也就是@@说@@,他们实际上可以实现很大的价值@@。他们不仅可以为客户提供更好的价值@@,而且可以带来利润@@。在过去@@,在以前@@,我们首先是@@提出问题@@,然后开始搜集数据@@@@@@@@,然后进行分析@@@@,最后拿到答案@@,最后把数据@@给扔了@@,因为数据@@已经完成了任务了@@,所以就把它扔到了@@。你要存储数据@@的话也是@@非常贵的@@,但是@@@@现在储存数据@@是@@不贵的@@。现在你可以应用数据@@实现更多@@的价值@@。你可以反复利用它@@,实现其它的目的@@。实际上我们看到的数据@@@@只是@@冰山一角@@。我们看到的是@@海洋之上的数据@@@@@@,大部分的数据@@@@是@@隐藏在海洋之下的@@。如果你重复使用这些数据@@@@,就可以发现潜在的价值@@。
 
  大家应该是@@听说过劳斯莱斯这个@@品牌吧@@@@?但是@@@@我这里提到的并不是@@这个@@奢侈品牌@@,不是@@这个@@汽车@@@@,而是@@@@飞机的发动机@@。大家应该也知道劳斯莱斯它也是@@为飞机制造发动机的@@。比如说像空客@@、380,都是@@他们提供的发动机@@。他们也搜集了大量的数据@@@@@@,比如发动机的温度@@、压力@@、速度@@、振动@@、噪音@@等等@@,这些数据@@就是@@发送到发动机的计算机之中@@,再发送到这些公司之中@@,那劳斯莱斯就把这些数据@@全部储存起来@@。飞机每一个@@发动机搜集到@@40G的数据@@@@,这些数据@@最后反馈到劳斯莱斯的总部那里@@,通过这些数据@@@@他们会发现世界上有多少飞机是@@在使用他们的产品@@。他们又分析了这些数据@@@@。比如说飞机是@@停在哪里@@,或者是@@什么时候哪里出了问题@@,实际上这些技术故障出现之前@@,他们就进行维修保养了@@。如果在飞机起飞的时候出问题的话@@,那肯定就不行了@@。劳斯莱斯发现如果仅仅是@@搜集数据@@@@@@,而且知道自己要做什么的时候@@,开始搜集数据@@@@@@,实际上已经为时已晚@@。最好的方式就是@@能捕捉数据@@@@,随时随地的搜集数据@@@@@@,有时候你可能不知道板怎么利用这些数据@@@@,但是@@@@先把它搜集起来@@,因为在未来@@,可能它就起作用@@。
 
  大家应该知道@@jawbone,这个@@手环@@的制造商@@,他们也在搜集这些数据@@@@,比如你起床@@、运动频率等等数据@@@@。我们也可以搜集数据@@@@@@,然后进行分析@@@@。去年加州发生了地震@@,在加州有很多人都佩戴@@jawbone,他们不断的搜集自己的数据@@@@@@,而且地震发生的时候@@,是@@在午夜@@,他们搜集的数据@@@@有一个@@区县@@,可以看到这里用户的数量@@,他们戴着@@jawbone手环@@,在晚上三点@@钟的时候@@,应该是@@大家都在睡觉了@@,但是@@@@突然地震发生了@@,然后我们看到这个@@峰值@@,因为地震发生的时候@@,大家肯定要从床上跳下来逃生@@,大家就看到了这样一个@@曲线变化@@。为什么这个@@数据@@特别的重要@@?因为不同的颜色代表不同的城市@@。就告诉大家这个@@地震的程度有多少@@,在不同地区@@,这个@@地震是@@大还是@@小@@。jawbone的用户他们很好的捕捉到了地震的数据@@@@@@,甚至比政府做得还要好@@。甚至比政府地震仪捕捉到的数据@@@@做得更好@@。jawbone就想了@@,我们不仅可以来预测地震@@,因为它现在已经搜集到了这些地震的信息@@。但是@@@@实际上这些大数据@@@@给我们提供了一个@@现代平台@@@@,大家可能听说过一年多前谷歌@@收购了@@@@nest,它是@@生产恒温计的@@。其中一个@@创始人我也认识@@。这个@@恒温计是@@调节你在家里环境的温度@@,谷歌@@收购了@@这个@@品牌@@,他们花了三十亿@@美金投资到这个@@公司@@@@,大家就想了@@@@,30亿@@,就买了一个@@恒温计的制造商@@,真的吗@@?值不值这个@@钱@@?他们并不了解谷歌@@的想法@@,这实际上是@@一个@@智能恒温计@@,这个@@恒温计可以记得你整个@@温度的调节@@,它可以记忆你这一天之中@@,哪个@@时间段是@@调节了温度@@,因此它就可以捕捉这些数据@@@@,了解你的行为@@,不论是@@你在家里@@,回到家的时候@@,是@@你想要温度上升@@,或者是@@温度下降@@,它在了解你的习性@@,了解了这个@@习性之后@@,数据@@发送到总部@@。那么现在谷歌@@就获得了很多人在家里的温度的情况@@,而且在哪个@@时间段需要什么样的温度@@,这些数据@@都搜集到了@@,大家可以想象一下这些数据@@的价值有多少@@。这样大家可以通过这样的方式来进行能源保护@@,节省能源@@,比如说你可以采取一些环保的措施@@,这也是@@为什么谷歌@@收购了@@这个@@品牌@@@@。它实际上提供了一个@@全新的平台@@@@。
 
  大家看一下这个@@照片@@,汽车@@,电动汽车@@@@,这个@@是@@一个@@非常漂亮的汽车@@@@,而且非常快@@。这是@@一个@@创新型的汽车@@@@。因为它是@@电动的@@。然后我们看这个@@车@@,特斯拉其实已经不仅仅是@@一台汽车@@了@@,它对于我来说@@,就是@@一个@@数据@@@@,它是@@一个@@数据@@搜集的平台@@@@,你在驾驶特斯拉的时候@@,实际上汽车@@上装载了很多的传感器@@,它可以去搜集到@@,比如说振动@@的数据@@@@@@,加速的数据@@@@@@,转弯的数据@@@@@@,包括汽车@@平衡性@@、稳定性的数据@@@@@@,都可以搜集到@@,包括整个@@的刹车系统@@、振动@@系统@@,包括一些应急措施@@,这些数据@@都可以搜集到@@@@,搜集到这些数据@@特斯拉怎么做呢@@?当然它可以进一步的提升汽车@@性能@@,比如去年的时候@@,他们进行了提升@@,特斯拉的用户会发现他们的软件是@@实时更新的@@。比如汽车@@行驶历程可以提升@@10%。特斯拉可以用数据@@发现这些用户去了哪里@@,充电站在哪里@@。或者可以用一种无人驾驶的汽车@@@@,可以帮助你驾驶@@。通过这些数据@@@@,它也可以告诉政府@@,这些路段哪一些地方比较安全@@,哪一些比较危险@@。这些是@@通过数据@@而来的@@,未来的汽车@@实际上就是@@搜集数据@@@@的平台@@@@。它不仅载着我们从@@A点@@到@@B点@@,也是@@一个@@数据@@的平台@@@@。
 
  大家听说过这个@@平台@@@@uber吧@@?它是@@一家出租车公司@@。这是@@通过交通出行来赚钱的公司@@。uber市场价值成千上万美金@@,为什么它有@@这么高的价值呢@@?它也是@@有数据@@@@,比如客户去了哪里@@,汽车@@的行使@@,等待时间等各种各样的数据@@@@@@,uber也是@@利用这些数据@@进行变革@@,变革我们移动的方式@@。当然这里也有问题@@,很多人都有汽车@@@@。在欧洲和美洲@@,几乎每个@@人@@都有自己的汽车@@@@。实际上你花了很多钱在自己的汽车@@上@@,但是@@@@这个@@汽车@@的使用率@@是@@怎么样的呢@@?大概只有@@4%的使用率@@,96%的时间@@,你的汽车@@就停留在那里@@。这个@@效率实在太低了@@。如果我们可以把这个@@效率提升@@,如果我们可以提出一个@@新的理念@@,使用自己的手机@@,然后按一个@@键@@,然后一个@@汽车@@@@,无人驾驶的汽车@@直接行使到你面前@@,然后你驾驶着它到另外一个@@地点@@@@,或者可以自动支付@@,上了这个@@汽车@@@@,载着你到另外一个@@地方@@,然后自动付款@@,然后它再去载另外一个@@人@@@@,这样汽车@@使用率就大大提升了@@,这样你就不用花很多钱去买汽车@@@@。现在这样的效率低下的情况就可以避免了@@。
 
  还有@@airbnb,这个@@是@@度假的时候使用的@@,比如你可以利用它来找民宿@@,你出去旅游的时候@@,airbnb可以帮助你把房子租出去@@,因为你出去度假@@,房子是@@空置的@@。我们看到这样一个@@现象@@,数据@@的效率转变资源效率@@。现在我们从数据@@转移到了资源效率@@,我们用更多@@的数据@@@@@@,我们处于大数据@@@@的时代@@。比如说我们不断的提升汽车@@的效率@@,移动的效率@@,房子的利用率等等@@。这都是@@有关于资源利用的效率@@。不管是@@@@uber、airbnb、谷歌@@,他们都是@@利用数据@@来提升效率@@,创造价值的@@。那谁拿到了这个@@数据@@呢@@?是@@uber这个@@公司@@拿到了数据@@@@@@。nest拿到了数据@@@@,谷歌@@拿到了数据@@@@@@。不是@@租房子的人不是@@旅游的人拿到数据@@@@,而是@@@@airbnb这家公司获得了数据@@@@@@,也就是@@说@@这些公司@@,他们在捕捉数据@@捕捉价值上做得非常好@@。
 
  大家想到数据@@@@,可能想到数据@@的规模是@@非常重要的@@,比如谷歌@@@@,谷歌@@是@@花了三十亿@@的美金@@,收购了@@nest获得了数据@@@@。在大数据@@@@时代@@@@,实际上这个@@规模可能没有你想象得那么重要@@。在美国有一个@@公司@@,它是@@预测消费品产品的价格@@,它就可以预测@@,比如像电视机的架构@@,它可以预测到电视机的价格是@@上升还是@@下降@@,他们可以直接预测到这个@@趋势@@。如果这个@@预测错的话@@,他们就会给你返回到差价@@。但是@@@@70%的概率他们是@@正确的@@。他们所做的也是@@捕捉数据@@@@,他们每天搜集到很多很多的价格点@@的数据@@@@@@,每一天成百上千万的用户数据@@他们都搜集到@@,还有@@消费品产品数据@@都搜集到@@,大家觉得这个@@公司@@规模有多大呢@@?总共@@30个@@人@@,包括清洁工@@。他们有多少服务器呢@@?0个@@,因为他们完全是@@使用云端武器@@。大数据@@@@好象听起来很大@@,规模很大@@,但是@@@@这一端@@,小的一端也是@@非常有意思@@的@@,就是@@一些初创公司@@,小的公司@@,也可以很好地使用这些大数据@@@@@@,因为你不需要购买很多的服务器@@,雇佣很多的员工@@,来搜集大数据@@@@@@。这些小的公司@@也可以搜集大数据@@@@@@,只要你有存储空间@@@@,有处理能力就可以了@@。而且这些成本也不高@@。因为我们有云端@@,因此大数据@@@@后面的基本的原理@@,一个@@理念@@,就是@@未来的数据@@@@已经不在于机器了@@,而是@@@@在于你的理念了@@。你需要有这样的理念@@,你要想象一下如何利用这些数据@@@@。这些云端可以帮助你处理一切的数据@@@@@@,非常感谢大家@@。

  维克托@@·迈尔@@·舍恩伯格@@:《大数据@@@@时代@@》作者@@,牛津大学网络学院互联网研究所治理与监管专业教授@@

责任编辑@@:admin