5月@@26日的贵阳数博会上@@,李彦宏@@出席了人工智能@@高峰论坛@@。李彦宏@@在演讲中@@,从@@“为什么百度不是一家互联网公司@@”讲起@@,介绍了百度目前在人工智能@@领域的突破@@。当讲到@@数据@@与算法哪个更重要的争论时@@,他在@@“大数据@@@@”的主场直言不讳地说@@:“数据@@不是根本@@”。

演讲全文@@:

大家好@@。感谢杨澜的介绍@@,我其实很早就看了杨澜拍的@@“人工智能@@”纪录片@@,我还蛮惊讶的是杨澜对@@人工智能@@有这么深入的了解@@,确实也花了很多工夫去采访全球各个地方人工智能@@方面的大咖@@。

我对@@这个领域非常热爱@@,以至于前两天我们在重庆开百度联盟峰会@@,当时我有一个演讲@@,讲到@@“百度不应该被称作一个互联网公司@@,而应该被称作一个人工智能@@的公司@@”,昨天见到杨澜她也问我为什么这么说@@?我当时在重庆没有展开说@@,今天借这个机会正好讲一下@@。

我觉得互联网公司这个概念现在确实不是特别合适了@@,原因就是互联网的普及程度已经非常非常高了@@。比如说今天我们在这儿开会@@,这个酒店叫凯悦酒店@@,我们不会说凯悦酒店是一个电力公司@@,虽然我们在这个酒店不管干什么都要用到电@@,互联网也是一样的@@,任何一个公司今天在做它的业务的时候@@,不管是什么业务你都要用到互联网@@,所以@@这个时候再说我是一个互联网公司@@,我觉得意义已经不大了@@。

但是为什么说我们是一个人工智能@@公司呢@@?因为人工智能@@现在才刚刚开始进入到各个领域@@,很多技术还在飞速发展@@,很多应用还没有获得足够多的重视@@,所以@@我们现在更希望给大家讲人工智能@@带来了哪些新的可能性@@。

刚才的片子里面其实也有很多的争论@@,人工智能@@会不会是一个不归路@@,会不会随着技术的发展@@,给大家带来很多不可预知的后果@@?这里头我想@@,首先要讲一下我在这方面的判断@@——很多时候是因为大家不了解所以@@才恐惧@@,很多人认为说人工智能@@就是让计算机在模拟人脑的工作方法进行工作@@,其实这是一个很大的误解@@@@,而且这个误解是非常非常普遍的@@,几乎我见到的人当中有一半的人都觉得人工智能@@是仿生学@@,就是让计算机来模拟人的大脑神经元是怎么工作的@@,怎么作出判断的@@,怎么作出推演的@@,那我们也这么去做@@,其实这是错误的@@。

就拿深度神经网络@@,它只是一个比喻@@,就是和人脑的工作方式有类似之处@@,其实到今天为止我们的科学也不知道人脑是怎么工作的@@,我们只是知道人脑有神经元@@,尤其是最近几年算法的发展都是计算机科学在搞@@,从@@来没有借鉴人脑科学的成果@@,这是一个很大的误解@@。

过去有好多对@@人工智能@@分类@@,有弱人工智能@@@@,强人工智能@@@@,超人工智能@@@@。弱人工智能@@就是现在的情况@@,强人工智能@@@@就是电脑和人脑的能力是一样的@@,超人工智能@@@@是电脑要超越人脑@@,我认为要达到强人工智能@@@@@@,也就是说电脑达到人脑的能力还有很长很长的时间@@,我不知道多长时间@@,也许几十年@@,也许几百年@@,也许永远达不到@@,所以@@这方面我觉得大家不用太担心@@。

有时候我拿它和原子弹相比@@,原子弹在发明之前@@,人类隔个几十年就要有大的战争@@,原子弹发明之后可能所有人都觉得人类的末日就快要到了@@,但一直到今天都没有发生大的战争@@,也许因为原子弹的诞生人类再也不会有大的战争@@,因为这样的战争会毁灭掉所有的人@@,大家还是知道如何来控制的@@,所以@@人类对@@于人工智能@@技术的这种探索@@、开发@@、演进我也是非常乐观的认为它带来的影响主要是正面的影响@@,负面的影响完全是可控的@@。

过去这一年@@,虽然只是一年的时间@@,像去年我也来了贵阳数博会@@,虽然只有一年的时间@@,但是人工智能@@的技术却是发生了非常大的变化或者说进步非常明显@@。

语音识别过去这一年@@它的进步就很明显@@,今天我们要进行搜索@@的话@@,比如你和朋友进行聊天@@,他说了一些词或者说了什么事情你不是很清楚@@,你甚至不知道他说的那个词是哪几个字@@,没有关系@@你用语音去搜索@@@@,它会知道你说的是哪几个字@@,按照我们的评测@@,人类对@@于搜索@@词的听力@@、识别能力大概只有@@82%的正确率@@,机器达到@@86%、87%的正确率@@,过去这一年@@语音识别准确率已经有了飞速的提升@@。

图象识别其实也是一样的@@,今天大家不管是在公园里面或者是办公室里面看到什么植物@@,你想知道它叫什么@@,你拍张照片立刻就能识别出来这个植物的名字@@,过去你用文字描述不出来一棵阴性树长什么样子@@,图象很好的能被计算机所理解@@,准确率过去一年也有很大的提升@@。人脸识别过去一年准确率非常高@@,一年前大数据@@@@人脸识别场景是一对@@一的@@,比如金融场景里面你要开一个会@@,你把身份证递交给他@@,或者你提交你的身份证号码@@,让你远程拍一个照片来验证一下你是不是你@@,今天的人脸技术可以搞清楚你是谁@@,你不用事先告诉他说我叫李彦宏@@@@,他拍一下就能知道你是谁@@。所以@@现在变成@@1对@@N的识别@@,这是最近一年有比较大的进步@@。

今天百度不是刷工卡进入门禁@@,而是刷脸进入门禁@@,几万人的场景它立刻可以认出来你是谁@@。最近还有一个两个传播比较广的例子@@,就是寻人的例子@@,其中有一个是重庆的孩子@@,他在@@5岁左右的时候走失@@,后来可能被拐卖到了福建@@,经过了@@27年之后@@,我们再来比对@@他小时候的照片和他现在的照片@@,发现他确实是同一个人@@。当时在重庆走失的时候@@,记录他的生日和后来他身份证上登记的生日是不一样的@@,姓名是不一样的@@,走失时间也都是不一样的@@,但是用图象识别技术可以识别出来他就是这个人@@。

更接近的一个例子是有一对@@老夫妇带着他的智障孩子去北京治病结果孩子走丢了@@,因为是智障说不出来自己叫什么@@,说不出来家里在什么地方@@,老夫妇在北京待了八个月@@一直在找他的孩子@@,最近也是通过人脸识别技术顺利找到了这个孩子@@,找到的时候他走失八个月@@@@,胡子拉碴@@,一般靠人脸识别很难识别出来他是走失的孩子@@。

过去我们觉得搜索@@场景可以使用自然语言@@,未来其他电器都可以进行自然语言交流@@,过去人发明工具之后都要重新学习一遍如何使用工具@@,未来不需要使用工具@@。我们最近在电视里面植入了@@ DuerOS 操作系统@@,它就可以听懂人话@@,现在看浙江卫视说切换到江苏卫视它就给你切换了@@,你看电视你说这个演员叫什么@@,它马上告诉你这个演员叫刘涛@@。

当然@@,这些提升其实和今天的主题@@“大数据@@@@”也是非常有关系的@@,之所以@@技术进步这么快@@,它就是依赖过去积累的大量的有价值的数据@@@@,再加上计算资源越来越丰富@@,计算成本越来越低@@,所以@@过去我们认为不可能的技术现在变得可能了@@。

当然@@了@@,就是说数据@@和技术@@,或者和算法到底是什么关系@@?其实也有各种各样的讨论@@,前一段时间我跟我们的一个工程师在讨论的时候@@,他给我说了一句话@@,他说数据@@秒杀一切算法@@,就是你有了最好的数据@@的话@@,多好的算法都打不过人@@。是不是这样呢@@?我觉得这个数据@@确实重要@@,没有数据@@训练的话人工智能@@走不到今天的@@,但是数据@@是不是根本呢@@?数据@@不是根本@@,数据@@有点像新时代的能源@@,像燃料@@,那么推动时代进步的是技术@@,是创新@@,不是这些资源@@。

我经常讲人工智能@@这一次@@革命是堪比工业革命的那一次@@革命@@,我们回想一下工业革命当时最标志性的东西是什么呢@@?是蒸汽机@@,不是煤@@,当然@@最早的蒸汽机就是诞生在煤矿@@,最早的蒸汽机是挖煤的时候有很多渗水@@,把渗水从@@矿井下面提上去@@,蒸汽机在煤矿发明的当时一开始它非常效率低下@@,就是因为不缺能源@@,所以@@没有关系@@@@,效率低下一点可以@@,但是我们绝大多数人不知道蒸汽机是谁发明的@@,你们知道瓦特@@,瓦特是在蒸汽机发明九十年以后才发明了比较高效的蒸汽机@@。

所以@@工业时代最宝贵的东西不是煤@@@@,是蒸汽机@@这样的技术革命@@、革新@@,而人工智能@@时代最宝贵的也不是数据@@@@@@,是因为数据@@带来的技术的创新@@。而且过去一年就有这么多的创新@@,有大幅度的提升@@,连我在这个领域的人都要觉得要改变心态@@,适应这种环境@@,适应各种各样的可能性@@。所以@@我们有时候就想@@,这个技术很多时候是指数的在增长@@,今天上午的时候也提到了摩尔定律@@,就是技术能力@@,计算能力是在指数增长的@@,可是人的思维@@方式大多数时候是在线性增长的@@,你看它现在是这个样子@@,它未来可能只是比现在好一点点@@

但其实不是的@@,一旦量积累到一定地步的时候@@,它会产生一些质的变化@@,是常人很难适应甚至无法想象的一个变化@@。比如说传说当中有一个过往为了奖励国际象棋的发明人@@,他说我很喜欢国际象棋@@,我想给你一个奖励@@,你要什么@@?这个发明人说@@,没有关系@@,我就要点麦子@@,你能不能在象棋的格里面第一个格子放一粒@@,第二格放两粒@@,第三格放四粒@@,这个看起来很少@@,但是全世界的麦子都放不满这个想起格子@@。

所以@@最近我在讲我们为什么要培养@@AI思维@@,这样的思维@@方式不是我们习惯的思维@@方式@@,技术革命带来不断的可能性@@,我们需要极早为未来的这种可能性做准备@@。今天像贵阳在大数据@@@@领域的名声已经树立起来了@@,已经占有了这种先机@@,但是怎么样把真正的数据@@资源变成创新能力@@,我觉得这是我们贵州或者贵阳需要认真思考的一个问题@@,过去的创新来源于实验室@@,来源于大学@@,而未来的创新@@,我觉得来源于数据@@@@,来源于场景@@,我们更好地把这些数据@@组织起来@@,把这些场景吃透@@,遇到问题解决问题@@,就产生了创新@@,这样的创新又会不断地培养我们的思维@@方式@@,跟得上未来科技的进步@@。

所以@@,我也是想借这个机会跟大家交流一下这方面的看法@@,希望贵阳能够未来不仅抓住大数据@@@@的机会@@,也抓住人工智能@@时代各种各样创新的机会@@。谢谢@@。

责任编辑@@:lihui