科幻电影里人工智能(Artificial
Intelligence,简称AI)被塑造为可以跟人类相亲相爱,并肩战斗的一份子。但现实生活中,为了能让人工智能像人类一样说话都是一个需要攻克的难题。
科幻电影《我是机器人》剧照
回归:
旧话题重回舆论中心
“人工智能”是时下非常热的话题,以至于但凡科技公司都要将业务与它挂钩。这股热潮缘于今年年初,谷歌旗下英国公司DeepMind开发的AlphaGO计算机程序,在与世界顶尖棋手李世石的五番棋对决中,以4:1取得胜利。这场人机对决,让沉寂了20年的人工智能再次回到舆论中心。
今年4月7日,艾瑞发布的《2015年中国人工智能应用市场研究报告》中,将人工智能的发展划分为了三个阶段——计算智能、感知智能、认知智能。
计算智能使得机器能够像人类一样进行计算,诸如神经网络和遗传算法的出现,使得机器能够更高效、快速处理海量的数据。
诸如传感器,图象,语音识别,大数据的自动驾驶汽车则属于感知智能,目前的感知阶段已经比较成熟,逐渐在向认知智能方向发展。
认知就是具备学习能力,能像人有记忆能力,具备决策能力。在这一阶段,机器将能够主动思考并采取行动,比如无人驾驶汽车,实现全面辅助甚至替代人类工作。
无论是硅谷的科技公司还是国内的互联网巨头,对人工智能的投入都是不遗余力的。
谷歌、FaceBook、微软、IBM都拥有自己的人工智能实验室。在这个领域最早发声的谷歌还把人工智能应用到它的各类型产品中。这其中包括我们已经熟知的AlphaGo人工智能系统、无人驾驶汽车、Google
Search缓解交通拥堵等。
百度则早在2013年就在硅谷设立一家人工智能实验室,取名“深层学习研究所”(IDL),招揽顶尖人才,以促进深层学习研究的开展。
一个不容忽视的发展趋势是,未来我们的生活将从工业时代完全过渡到一个全新的智能时代。人工智能会受人类的控制而更好地服务于人类,拥有更多的功能,应用到更广泛的领域。
而这里有一个重要的课题需要解决:人类怎样才能顺畅的与机器进行交流,让机器真正能与人类实现对话。
难题:
如何让AI像人一样说话
科幻爱情电影《Her》讲述了一个人类与人工智能相恋的故事。作家西奥多在结束了一段令他心碎的爱情长跑之后,爱上了电脑操作系统里的女声。这个叫“萨曼莎”的姑娘其实是一款先进的人工智能操作系统OS1,她能够与人类对话,不断丰富自己的意识和感情,善解人意的“萨曼莎”很快就与孤独的西奥多成了无所不谈的朋友。
事实上,就目前的技术而言,人类与人工智能实现如同科幻电影里的顺畅交流并非易事。因为机器现在的智能语音停留在对关键词的内容识别和上下文分析,而机器是没有“语感”的,也不懂得什么语法。要将人类的语言用数学逻辑的形式解析并让机器理解、学习这中间存在的问题就是,语言是不是能够被数学化?语言如何能被数学化?
最近,谷歌旗下的人工智能公司DeepMind又憋了一个大招,他们研制出了能够生成模仿人类语音的系统Wavenet,该系统让机器说话与人类说话之间的差距缩小了50%。
在英文和中文进行的盲测中,听者普遍认为,相比谷歌任何现存的运用不同科技手段的文字-语音转换程序,WaveNet生成的语音都更加自然。
尽管Wavenet系统的研发是人工智能领域的重要突破,但这仍然是一个实验室产品,人类与机器要实现顺畅的交互仍然需要等待技术的进步。
竞争:
交互体验是唯一衡量标准
让人类和机器对话是人机交互领域长久以来的梦想。语音正在成为人类和机器互动中越来越重要的手段。企业在这个领域的竞争无疑也是激烈的。但TechWeb在与部分人工智能初创企业对话中发现,这个行业的竞争还没有走向红海。
蓦然认知是一家成立于2016年5月的公司,其创始人戴帅湘曾担任百度自然语言处理主任架构师。尽管成立时间不长,但蓦然认知推出的人机对话引擎Mor首次出现在TechWeb线下沙龙IT龙门阵上时,还是惊艳了众人。
这款产品的交互体验十分顺畅,响应速度非常快。在其有关订机票业务的演示中,Mor可以实现口语理解,场景下的上下文理解和多轮对话,不断修改需求,直至订单完成。
Mor的聪明之处不是它能够完成指定的任务,而是能够进行上下文的联想,推荐出个性化只适合你的方案。“我们想做的就是让机器更好理解人的语言,帮人办理各种业务,成为你的私人秘书。”戴帅湘更愿意这样介绍Mor,“国内唯一一家能够全语音完成复杂任务的决策引擎。”
与Siri或者微软小冰不同,Mor从诞生之初就是为了帮助人类完成任务。而这种任务并不是智能客服式的,从既定的答案库里挑选出一条给予用户。戴帅湘向TechWeb介绍称,“Mor的决策是一个与用户多轮交互的过程,交互的目的是要将用户给定的任务完成得最漂亮。这个优化目标是一个动态的过程,机器不能随机的给你,这不是优化。每个人都是独特的,Mor会给你更个性化的推荐,Mor在完成用户给定的任务时是没有既定答案的,但是有既定的目标,就是要完成你给予的任务。”
目前无论是科大讯飞、云之声还是思必驰等都瞄准了语音交互与智能硬件相结合的场景。作为初创公司,戴帅湘在与TechWeb对话中表示,这个市场其实并不是特别激烈,因为用户使用语音交互的习惯并没有完全培养起来,另外就是,这个领域其实没有真正的巨头。
但不可否认的是,对于语音交互的需求是很大的,一款语音交互体验好的产品必然会得到更多服务商的亲睐。目前比拼的就是谁的产品交互体验更好。
入口:
未来智能生活的核心
人工智能与人类的生活会有多紧密?科大讯飞轮值总裁胡郁给出的答案是,未来的10年里,人工智能也会像水和电一样进入到我们的生活当中,让每个人都离不开。
近日在新浪科技C+峰会上,胡郁演示了科大讯飞的语音转写产品。胡郁演讲过程中,他的所有发言都能实时转化成文字展示在屏幕上。而这项语音转写技术的反应速度相当惊人,几乎已经达到了音画同步的节奏。可以想见,未来的会议当中,有了这项技术,速记这份工作完全可以被取代。
当然,科大讯飞的野心肯定不是要取代人工速记,胡郁在演讲中介绍,“我们要做语音和语言为入口的机器认知革命,这里面包括感知智能和认知职能。让机器模仿我们人类的感知智能,可以对概念进行推理和解决。我们期待将来可以看到非常好的物联网的世界,手机、智能家电、智能家居……都能够跟我们自由的交流,我们可以进入一个真正的机器认知的革命时代。”
瞄准未来物联网入口的并不只是科大讯飞,戴帅湘在与TechWeb对话中表示,蓦然认知在做的正是颠覆现有人机交互方式,颠覆信息获取方式,打造下一代物联网入口。
在即将进入的物联网时代中,语音交互被视作为人机交互的入口,可以想象未来的智能家庭生活中,你所接触到的冰箱、音响、电视机都将透过语音技术、图像识别等方式,更好的为你提供服务。未来机器不再是冰冷的器械,因为有了人工智能,有了语音交互技术,它们不仅能听懂你说的话,更懂你的心。