近日,百度硅谷人工智能实验室(SVAIL)宣布,百度已开源人工智能软件
Warp-CTC,公开了关键代码。对研究人员来说,该软件可用于解决绘制输入序列到输出序列图谱过程中的监督问题,如语音识别问题。百度表示,代码将开放给所有从业者。分析人士预计,这一举措将推动人工智能产业的快速发展,并帮助百度在人工智能标准化发展中掌握主动权。
(百度位于美国硅谷的人工智能实验室)
Warp-CTC是百度前期为了在最新的计算机芯片上更快速运行而专门研发的一种改良版深度学习算法。Warp-CTC所需的存储空间小,比普通CTC速度快数百倍。百度硅谷人工智能实验室目前已向GitHub上传了Warp-CTC代码库,鼓励开发者试用这些代码。百度表示,希望此次开源能促使端到端的深度学习变得更简单、速度更快,加快研究者的进度,进而对机器学习领域的进步做出贡献。百度开源Warp-CTC代码库访问方式:https://github.com/baidu-research/warp-ctc
据了解,部分代码已被用于开发一款强大的深度语音识别系统Deep Speech
2,对于一些简短的句子,该系统比大多数人类更善于正确地识别语音。该技术使百度数亿用户可以更好的访问其语音服务,尤其是在移动端。
这次开源关键代码,并非百度第一次开放在人工智能领域的能力。早在去年5月,百度开源了其深度学习平台。通过这一开源平台,世界各地的开发者们获得了免费优质的深度算法源码,大幅降低开发和部署分布式机器学习系统及相关应用的门槛。
纵观国际,谷歌于去年11月开源了TensorFlow系统,而Facebook也于去年12月公开了Big
Sur人工智能硬件架构。分析人士认为:国际科技巨头纷纷开源人工智能技术,一方面将迅速降低开发者部署深度学习系统的难度,推动创新应用及人工智能行业快速发展;另一方面,有利于企业在人工智能技术标准化发展过程中占据主动位置,抢占技术创新背后正在产生的巨大市场红利。
作为全球人工智能布局较早的企业,百度拥有领先业界的技术实力。从2013年百度深度学习研究院(IDL)的创建及2014年Andrew
Ng的加盟至今,百度不断在深度学习的多个应用领域进行探索,并取得国际领先的技术成果,上线了如xgboost(速度快效果好的Boosting模型)、CXXNET(极致的C++深度学习库)、Minerva(高效灵活的并行深度学习引擎)以及Parameter
Server(一小时训练600T数据)等产品,在语音识别、OCR识别、人脸识别以及计算效率提升上发布了多个成熟产品。