速途网3月22日消息(报道:李楠)去年是智能音箱在中国爆发的一年,阿里巴巴、小米、渡鸦、出门问问等接连发布了智能音箱,它们也拉近了人工智能与公众之间的距离。进入2018年,智能音箱将何去何从?升级点又在哪里?
今天,阿里巴巴人工智能实验室春季发布会给出了上述问题的答案,发布人机交互系统AliGenie2.0版本,让外界看到阿里AI
Labs将工作重心放在了系统升级上,基于AliGenie2.0,天猫精灵也成为首款能“看见”的智能音箱。
值得注意的是,发布会上阿里巴巴人工智能实验室负责人浅雪也对外公布了销量成绩:天猫精灵上市200多天,实现了200万台销量,持续领跑中国智能音箱市场。
据速途网了解,去年双11,天猫精灵创下了单日100万的销量,也成为唯一一款销量超过100万的中文智能音箱产品。从去年双11至今,天猫精灵在没有大规模市场活动的情况下,累计销量突破了200万,这是由市场需求、产品口碑带动的成绩。
在全球市场,最畅销的智能音箱亚马逊ECHO达到这一数字,用了一年多的时间,而天猫精灵只用了200多天时间。
“去年天猫精灵双11百万销量证明了中国智能音箱不是伪命题。200万台销量,证明了中国智能音箱市场比美国更大、发展速度更快。这就是中国人工智能的加速度。”
阿里巴巴人工智能实验室负责人浅雪表示。
发布AliGenie2.0,利用视觉认知、多模态交互加速升级
200万销量对于阿里巴巴来说到底以为着什么?事实上,各大知名品牌智能音箱在初期采用低价策略,培养用户习惯,有利于不断完善自身系统,加快升级改进。因此,AliGenie
2.0诞生,并引入了视觉能力,为天猫精灵带来新的能力升级。
据浅雪介绍,AliGenie 2.0的视觉能力包括图像识别、人脸识别、物体检测。AliGenie
2.0还引入多模态交互能力,通过对语音、图像、触摸等多种交互形态的融合,让机器和人的交流,更像是人与人之间的交流。同时,AliGenie2.0还具备情景感知能力,基于你所在的上下文、对话场景自主学习,深刻理解情景需求。未来,AliGenie将不仅能识别“命令”,还能理解你的“情感”,并且进行情感反馈。
在阿里巴巴人工智能实验室看来,智能音箱终极形态是家庭机器人,从“听”“说”,到“视觉交互”,再到“行动力”,阿里巴巴希望通过引入视觉能力加速这种进化。
“行业真正需要的不是销售数字,而是持续创新的力量。因此我们选择发布这样一套系统,希望带领行业向更高维度进行能力升级。”阿里巴巴人工智能实验室负责人浅雪表示。
发布精灵火眼,天猫精灵成“精”
AliGenie
2.0首先将视觉能力落地在天猫精灵X1。然而,天猫精灵并没有推出一款“带屏幕的音箱”,而是推出了“精灵火眼”功能:通过现场发布的XHolder外设,及天猫精灵手机APP“精灵火眼”功能,所有天猫精灵X1用户都能连接自己的手机,为天猫精灵加一块屏幕。天猫精灵还能调用手机摄像头,具备视觉认知能力。
“我们希望通过精灵火眼,以普惠的方式让大家在不增加硬件成本的前提下,体验到视觉的魅力”,阿里巴巴人工智能实验室负责人浅雪表示。
“精灵火眼”初期上线了读书、识别药盒等功能,未来将具备万物识别、人脸识别等功能。面向儿童使用场景,“精灵火眼”与国内顶尖的出版社合作,精选了适合3岁到8岁儿童的117套图书,如《小猪佩奇》等热门IP。
面向老年人使用场景,“精灵火眼”推出识别药盒的功能,能识别4万种药盒,只要扫一扫药盒,就能用语音播报药名、功效、过期日等信息。
在活动现场,阿里巴巴人工智能实验室还牵手马云公益基金会,共同推出“天猫精灵儿童公益计划”,将天猫精灵送下乡,陪伴每一位儿童成长。
除了火眼,还有多款硬件发布
发布会上,阿里巴巴人工智能实验室还发布了天猫精灵曲奇版、智能投影天猫魔屏S1和天猫路由器。
作为阿里巴巴智联网战略的一部分,阿里巴巴人工智能实验室未来将语音交互、视觉交互、机器行动力等结合在一起,推动家庭智联网的落地。
在阿里巴巴人工智能实验室看来,天猫精灵的本质是一个家庭智能终端,具备认知能力、理解力,执行力,而且在不断进化。它不仅是一个智能音箱,还可以连接其他家电、家居产品进行智能控制。
阿里巴巴人工智能实验室在开发天猫精灵的过程中,发现家庭智联网遇到的最大的挑战是网络,所以开发了天猫路由器,去解决连接问题。
传统客厅场景,电视是核心。天猫魔屏S1能把一面白墙变成一个电影院,并与天猫精灵连接实现语音交互,是对客厅场景的重新定义。
“我们从来不认为智能音箱就等同于一个遥控器,我们也从来不认为屏幕等同于视觉能力。阿里巴巴人工智能实验室对于AI有我们自己独特的理解。我们希望未来的家庭,不是House,而是Home,带给大家温暖和想象。”
阿里巴巴人工智能实验室负责人浅雪表示。