“百度语音技术平台的日均调用量已经超过100亿!”11月28日,百度大脑语音能力引擎论坛上,百度首席技术官王海峰亮出百度大脑语音技术最新进展,并表示,百度还将继续开放语音等核心AI能力,与广大开发者共同推进产业智能化进程。
王海峰说:“AI技术的进化和产业赋能正向循环,相互促进,AI在应用场景中不断进化。百度的语音技术基于深度学习和产业应用加速突破,已应用到百度App,百度地图、小度音箱,百度输入法等百度产品,更通过AI开放平台赋能众多产业伙伴。”
百度是世界上最早应用深度学习技术的公司之一,2012年就已经应用于语音识别。经过多年发展,最新的基于SMLTA的语音识别技术已很好解决了噪声、口音、中英文混读等问题;语音合成技术也实现了仅基于20句话便能生成流畅、富有情感的个性化语音。
毋庸置疑,百度语音技术仍在持续进步。会上,百度语音首席架构师贾磊全新发布了基于复数CNN网络的语音增强和语音识别一体化端到端建模技术。该技术将彻底打通语音信号处理和语音建模、语音识别之间的鸿沟,带来的不仅是硬件成本的进一步降低,而且会使智能家居场景下智能音箱语音识别率大幅提升30%。据悉,目前该方法已经被集成到百度最新发布的百度鸿鹄芯片中。
百度领先的语音技术已广泛应用于百度App、国内出货量第一的小度音箱、“新一代人工智能地图”百度地图、百度手机输入法等产品中,并过AI开放平台赋能众多产业伙伴。在开放层面,目前百度大脑已开放了云、端、芯包含语音识别、语音合成等全栈语音能力,并广泛应用于文娱、金融、政务等多种行业和场景,日调用量超过100亿,应用规模已达到业界第一。
当天,百度大脑语音引擎也全新发布和升级了14大产品,包括基于百度鸿鹄语音芯片的4款硬件模组、开发板及3大场景解决方案,升级了语音自训练平台、呼叫中心语音解决方案等。多位来自家电、农业、医疗等行业的企业代表也在现场分享了百度大脑语音技术赋能的成果。
以百度语音为代表的百度大脑AI技术,正在自身进化和开放赋能中,形成正向循环。“开发者的事业和我们自己的事业共同进步,未来这条道路会越走越宽广。”王海峰说。