近日,美国《财富》杂志(Fortune)发表题为“Why deep learning is suddenly changing your
life“的文章,文中深入介绍了包括百度、谷歌、微软、Facebook在内的全球四大AI巨头在人工智能的布局以及深度学习对人们日常生活带来的改变,其中重点谈到了唯一一家中国企业——百度在该领域的技术突破及其首席科学家吴恩达在深度学习方面的一系列观点。
文中称,由于深度学习技术的不断发展,人们的生活正在发生翻天覆地的变化。其中,语音识别、图像识别、机器翻译等技术的成熟尤为明显。如今,人们可以使用语音命令打电话,通过语音实现人机交互,机器翻译等其他形式的语言处理技术也变得更加令人信服,百度、谷歌、微软、Facebook每月都会学会新的技能,其中包括翻译软件提供生僻语言的文本翻译。
而上个月百度世界大会上,李彦宏发布的“百度大脑”恰恰都将这些技术囊括其中。在语音方面,百度的语音识别准确率达到97%,其语音技术公开专利数量达到404项,占国内智能语音公司公开专利数量的57%,并被《MIT
Technology
Review》评为“2016全球十大突破技术”。在图像方面,百度优势同样明显。人脸识别技术可实现72个人脸特征点检测和实时追踪,识别准确率达到99.77%,超越了人类。此外,百度的机器翻译技术也已实现27种语言,702个方向的翻译,每天响应来自全球数亿次的翻译请求。
本次《财富》杂志的深度报道中,在全球众多的AI公司中,重点介绍了Google、微软、Facebook、百度,一方面是因为这四家公司掌握了深度学习所需的海量数据,更值得一提的原因是,迄今为止,全球大部分的人工智能和深度学习的商业应用都来自这四家公司。以唯一一家中国企业百度为例,目前,语音、图像技术已嵌入到手机百度、百度地图、百度输入法、百度图片、度秘等多个明星产品中,过去18个月中,百度语音接口的使用量已经增至原来的3倍。而百度翻译等运用机器翻译的产品在全球覆盖超过47亿人口,同时支持上万家第三方应用,每天都在服务着海量的用户,惠及人们的日常生活。去年12月发布的无人车,在不到一年的时间里,建立了多个无人车示范区,在中美两地同时路测、每天收集海量的路测数据,训练百度的汽车大脑,信守“三年商用,五年量产”的承诺。
文中特意提到了计算能力及数据量对于深度学习发展的重要性。受限于当时的计算能力和数据量极为有限,深度学习发展滞缓。直到计算能力又提升了3到4个数量级以及研究人员发现了GPU加速的秘密之后才开始改观。据悉,百度创新性的利用大量GPUs组成HPC(高性能计算机群),用其训练深度学习。研究人员通过提高GPUs的使用效率,提升训练神经网络的速度及规模。目前,百度拥有全世界最大规模的深度神经网络,万亿级参数,支持千亿样本、千亿特征训练。
除了将深度学习技术应用在百度自身的技术产品上之外,百度已经开源了多项人工智能技术相关的代码及平台。2016年,百度先后开源了让人工智能软件运行更高效的代码Warp-CTC、深度学习平台PaddlePaddle、基准工具DeepBench。
对于深度学习和人工智能的未来趋势,吴恩达表示:“在过去,许多标普500强CEO希望自己能早点意识到互联网战略的重要性。今后5年也会有一些标普500强CEO后悔没有早点思考自己的AI战略。AI就是新的电力,100年前电力变革了一个又一个行业,现在AI也会做同样的事情。”未来,百度将进一步发挥技术专业优势,并不断开放技术能力及底层算法,全面推动人工智能技术快速应用及发展。