Artificial Fiction Brain (Wikipedia)
北京时间5月19日凌晨1点,本届谷歌I/O开发者大会在加州举行。延续此前AlphaGo的话题度,人工智能不出意外成为贯穿全场的主题。
首先也是重点被介绍的便是Google Assistant,新任谷歌CEO Sundar Pichai介绍道,它能够跟你对话,联系上下文语境,甚至帮你做出决策。谷歌希望它不仅仅是Android手机里的一个语音助手,还想让它连接智能手表、智能汽车、电脑、客厅等。
听起来很熟悉是不是?没错,就在上个月,百度推出的度秘机器人入驻肯德基智能概念店,成为了一名真正落地现实生活的智能小服务生。
百度度秘机器人入驻KFC智能概念店
顾客:“我要一个2号度秘能量套餐,九珍果汁可以换成可乐吗?”
度秘:“好的,您确定要换成可乐吗?”
顾客:“是的。”
听起来是不是觉得很好玩,其实这就是具备了简单人类思维意识的人工智能产品。消费者不但能够用日常语言和餐厅里的人工智能机器人对话,完成从点餐到支付的智能点餐交互,还能够通过全息投影技术,现场感受人工智能机器人,进行零距离互动。
不同于谷歌的初步尝试,度秘已内嵌到搜索引擎中供用户正常使用多时。从百度世界大会推出度秘,到谷歌I/O开发者大会将Google Assistant提上日程,不难发现,人工智能生活化场景愈发成为IT巨头的着力点。目前,全球最大的两个深耕人工智能研究的公司谷歌和百度,在人工智能上生活应用中都做到了哪一步呢?人工智能的未来发展趋势又是怎样?在AI发展上,中国处在哪一梯队上?我们不妨趁着谷歌I/O大会好好梳理一番。
搜索是最大的导流入口,得流量者坐拥天下,百度和谷歌早年都以搜索引擎为发展起点逐渐成长为复合型科技公司,所以选取这两家作为对比最能说明问题,除此之外:
(1)4月13日下午,百度CEO李彦宏通过内部邮件宣布百度业务架构重组,剑指谷歌。
最新的百度业务架构重组图(2016年4月)
早在去年8月,谷歌宣布成立新的母公司Alphabet,谷歌纳入旗下成为全资子公司,将许多非互联网核心业务剥离谷歌独立运营。
最新的谷歌业务架构重组(2015年8月)
(2)均以搜索引擎起家,各自发展成为雄踞东西方的霸主,在人工智能方向上的布局非常相似,大部分产品已经很好地投入使用。
(3)谷歌曾有多名优秀人才流向百度,包括但不限于:谷歌大脑之父Andrew Ng(吴恩达)、王劲、刘骏、郑子斌以及新贵教主楼天城(ACRush)等。百度一向对高端人才求贤若渴并且毫不吝啬,业内广为流传“百度是靠技术引领,腾讯是靠产品引领,阿里是靠运营和HR引领”。
关于ACRush加盟百度美研的知乎提问:
https://www.zhihu.com/question/43704320
Andrew Ng发Twitter和Facebook欢迎楼天城加盟百度美研
近年来,百度和谷歌均在人工智能方面投入了巨大的财力和精力,百度已经超越余凯引领IDL的时代,而谷歌也早已不是墙内人民广泛意识中的Google X Lab那么简单。总体上看,百度开发的度秘、语音 / 图像识别与搜索、无人车、机器翻译等都已成功植入到各条产品线投入使用;谷歌开发的DeepMind AlphaGo、开源深度学习系统TensorFlow、智能化家居、Google Now、语音 / 图像识别与搜索、无人车、机器翻译中有一些还处于科研探索阶段,有一些收购以后还没有比较实用的产出,业务布局广而泛。
百度部分
(1)度秘 / 小度机器人
度秘 / 小度机器人
度秘是2015年百度世界大会上百度首度推出的为用户提供秘书化搜索服务的机器人助理,它能够通过自然的交互方式,依托强大的智能搜索技术,在准确理解用户意图的基础之上,与用户进行信息、服务、情感的交流。
App端调用度秘演示
不同于常规搜索引擎一问一答的交互模式,度秘机器人的核心功能在于能简单模仿一颗真实人脑与用户进行实际轮询问答,文本、图片或语音多模态输入皆可。虽然现在技术还不够智能和完善,但是这种脱离解集合约束的开放性强人工智能模式代表了未来必然的发展趋势,要想让机器模拟人脑的思维意识,需要用到很多技术才能精准定位用户真正的需求,以度秘的技术架构为例,交互层需要用到多模交互技术,对用户的文本、图片或语音输入进行智能识别,转换成计算机能够理解的中间状态,再由调度系统从搜索引擎中(包括O2O服务、互联网大数据和知识图谱等)寻找相关解决方案推送给用户。
度秘的技术架构分解示意图
入职KFC的智能点餐机器人度秘
类似的嵌入定制化智能点餐交互服务可以让人工智能从线上走到线下,从学术化走向商业化,从“听”和“说”向沟通进化。
(2)语音识别与搜索
在基于深度学习的语音识别达到比较理想的商业化状态后,让语音交互变得更加智能成为科学家们的下一个研究课题。举个简单的例子,当你想了解黄晓明的家庭成员时,一般会在搜索框中输入“黄晓明的老婆是谁”,返回结果为Angelababy,如果想继续知道“黄晓明的妈妈是谁”,就必须重新输入这整句话才会得到结果。试想一下如果搜索引擎具备了人脑的思维方式,整个过程将会变成:“黄晓明的老婆是谁”→“Angelababy” →“妈妈呢”→“张素霞”,相当便捷。如果将这种搜索方式以语音的方式交互,省去在小块手机屏幕上打字输入的烦恼,对搜索用户体验将带来极大的提升,这就是百度的语音搜索功能。语音搜索是一个结合多种人工智能技术的典型应用,包括但不限于语音识别(speech recognition)、自然语言处理(natural language processing, nlp)、机器学习(machine learning, ml)和对数据的挖掘(data minging, dm)和呈现(data visualization),可以通过语义理解与多轮对话精准识别你的需求,带有一定的思考判断能力。可以预见的是,语音搜索已经开始应用到智能硬件服务、汽车导航助手、基于语音特征的金融支付、新闻媒体和咨询顾问等行业中了。
具有多轮对话功能的百度语音搜索
(3)图像识别与搜索
丰富的社交网络让人人自带媒体属性, 情感在互联网上被肆意发泄,可以无时无刻分享心情和照片。最近几年因深度学习被大力推崇与发展,搜索功能也变得不再单一,尤其是语音和图像搜索与识别技术开始大放异彩,无数科学家前后投入希望搜索引擎更加智能地服务用户。比如哪一天你在朋友圈刷到一张美女明星图,不追星的你出于对美女的钟爱也很想知道这是哪位明星以及她的基本资料,只要将图片保存后上传到图像搜索引擎中分析识别即可。
基于海量数据的百度图像识别
(4)无人车
百度无人车
去年12月,百度宣布百度无人驾驶车国内首次实现城市、环路及高速道路混合路况下全自动驾驶,从位于北京中关村软件园的百度大厦附近出发,驶入G7京新高速公路,经五环路,抵达奥林匹克森林公园,并随后按原路线返回。百度无人车的核心技术是百度汽车大脑,由百度地图提供高精地图、高精定位和智能决策与控制,人工智能技术提供感知语音 / 图像感知与识别技术。其中:
● 百度超级计算机Minwa在一项以 ImageNet 对象分类为基准的人工智能测试中,图像识别的错误率仅为4.58%。
● 在国际通用街景数据集KITTI的车辆识别准确率达到89.32%。
● 汉语安静环境普通话语音识别的准确率接近97%(NCMMSC2015)。
都处于行业领先水准。
谷歌部分
(1)DeepMind
2014年1月,谷歌以4亿美元收购了英国深度学习算法公司DeepMind,经过近两年多的发展,DeepMind开发的围棋对弈系统AlphaGo在新世纪人机大战中4:1击败韩国围棋冠军,一鸣惊人。翻阅官网可以发现DeepMind的Publication相当high level,发过Nature这样的顶级科学期刊,也有NIPS和ICML等这样的顶级国际会议录入,科研水准丝毫不输于给同当量的任何一个公司,在工业界十分难得。
DeepMind的Publication列表
(2)语音 & 图像识别与搜索
谷歌早在14年就开发了一套能够整合公司海量数据的语音系统,它能使计算机“听懂”和“思考”说话人向系统输入的语音指令,并且准确率高达98%,后续在此基础上又推出了Google Now语音助手,可惜由于版本限制和国情因素在中国的普及率很低。此次谷歌力推的Google Assistant,业内将其视作高配版的Google Now。
同年8月,谷歌通过收购图片分析公司Jetpac加强了自身在图像识别方面的能力。
(3)自动驾驶汽车
谷歌是最早在无人驾驶汽车方面投入的公司,这一方面甚至远远领先于传统的汽车厂商。目前谷歌的无人驾驶汽车已经累计行驶了150万英里路程,无论是从技术还是产品形态上谷歌无人车都是世界领先地位的,遗憾的是今年初谷歌Lexus无人驾驶汽车竟然在以2英里速度行驶的状态下与一辆公交车相撞,并且该起交通事故的责任方就是谷歌,在这次事故中体现出了智能系统没能完全判断准确人类的行为,直接将民众对无人驾驶的信任打击得消失殆尽。
或许是因为谷歌无人车在智能系统上还有待完善,尽管此前媒体预测谷歌在总部开I/O大会可能是为了更好展示无人驾驶汽车,但会上谷歌并没有谈这个话题,无人车仅仅成为场外的一道风景线。
谷歌的无人驾驶汽车
(4)智能家居生态系统建设
14年1月,谷歌以32亿美元收购了智能家居制作商Nest;14年6月,谷歌通过Nest花费5.55亿美元收购了基于云端的家庭监控Dropcam;14年10月,收购了智能家居中枢控制设备公司Rovolv;15年10月,又花3亿美元投资了前谷歌员工创立的智能手表公司出门问问,帮助Android Wear落地中国。关于这一块,我曾在《谷歌返华:谁会看好,谁在唱衰,谁会恐慌,谁又在期待》(http://www.huxiu.com/article/132799/1.html)有过具体分析。
(5)开源机器学习平台TensorFlow
TensorFlow一度被誉为是人工智能领域的安卓系统,其原型可以追溯到2011年开发的深度学习基础架构DistBelief,可以在小到一部智能手机、大到数千台数据中心服务器的各种设备上运行。TensorFlow在很多地方都能应用,如语音识别、自然语言理解、计算机视觉、广告等。已支持CNN、RNN和LSTM算法,这都是目前在Image、Speech和NLP中最流行的深度神经网络模型。
以上,便是百度和谷歌在人工智能方面的产出概况。谷歌的Google X思维比较天马行空,虽然成果多点开花,但后期基本靠收购中小型新兴企业来扩充创新产品线,再者由于中国国情特殊,对中国民众来说关于谷歌往往只停留在新闻媒体了解的阶段。百度虽是后起之秀,但由于适应国情,不断自我调整产品适应民众,战略重心从本土到国际,在中国一直处于绝对领先地位,正如普利策奖得主、《纽约时报》驻硅谷记者约翰•马尔科夫所言,相比于程序化的计算,人工智能的价值其实更在于那些人们习以为常的小事,比如倒一杯咖啡,照顾小孩这样。而今天,这样的人工智能正在走进我们的日常生活。也许不到10年,我们每一个人都会变成人工智能的受益者。
特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。