12月12日,百度“看懂AI-百度技术开放日”活动于海南召开。百度IDL(Institute of Deep Learning深度学习实验室)负责人林元庆指出,AI的研发轨迹已经处在爆发期边缘,人工智能技术的快速迭代、大规模应用时代即将到来。
“大应用”决定AI上限
目前,大部分研究机构将人工智能研发的三大要素总结为:机器学习、大数据、大规模计算。而在百度研究院看来,三元素并不足以构成完整的AI研发,“一款人工智能产品想做到极致,还需要由大应用将三元素补足为四大支柱”,林元庆如是表示。
而在谈及人工智能发展情况时,林元庆认为,人工智能的发展轨迹主要由三部分——平缓的技术准备期;突然爆发的早期应用期;以及趋近成熟的大规模应用期。此外,林元庆还对当前“AI就是炒概念”的舆论作出评价:承认市场泡沫存在,但同时坚信火热的AI市场有助于推动技术发展。
世界大会后,百度AI获得了这些进步
在今年举办的百度世界大会上,李彦宏和吴恩达曾现场演示了百度人工智能中枢百度大脑的多项功能。而在三个月之后的今天,百度大脑在图片检索、人脸识别等项目上又有所突破。
李元庆介绍,在2015年末时,百度大脑的图像误识别率在8.0%左右;在今年世界大会期间,该数字被缩减至2.3%;如今,这一数字再次被缩至小于1.0%,即识别率超过99%。在今年乌镇的世界互联网大会上,运用该技术的百度人脸闸机就被投放在乌镇景区。其高于99%的识别率,优于指纹识别95%的识别率,且能够大大提高通过效率。
同时,百度AI的细粒度图像识别技术,也迎来部分突破。据悉,百度细粒度图像识别技术在Stanford Dogs、UCSD Birds(CUB-200-2011)等公开测试集中保持世界领先识别精度。细粒度图像识别技术其实很简单,就是能够更加具体的描述图像中物体。例如传统AI技术只能识别出图像中的是一条狗,而细粒度图像识别技术则能够判断狗的品种。
百度将该技术与O2O相结合,开发出了“自动识别菜品”的系统,用户只需拍照上传,就能清楚地知道该菜的名称、制作饭店等信息。通过该技术,O2O平台将由推荐饭馆、升级为推荐某饭馆的某道菜式,优化用户体验,使推荐精度更高。
另外,在AR技术、通用图像技术、OCR等技术中,百度也获取了较为不俗的成绩。其中百度AI于ICDAR公开数据集的8个评测里,共取得了5个第一,展示了监测和识别技术能力。
除了推荐菜品,AI还能大范围应用于传统行业
目前,百度AI的应用领域主要包括检索、无人驾驶、自然语言处理等,但实际上AI有着更为广阔的应用前景。
林元庆用前段时间沸沸扬扬的虹桥机场事件为例,假如虹桥机场中植入不知疲倦的人工智能系统,就能防止人为失误,增强安全性。同时,AI的人脸识别等技术,也能够有效缓解案件过程中的长队现象。
除了应用于机场,人工智能技术还可以与很多传统行业相结合,用机器从事重复度较高的工作,解放劳动力。
“人工智能,不是增加一个功能,而是全新的思路”,在林元庆的诠释中,AI将是传统技术的替代者,而非简单的功能补充,“百度的下一幕就是人工智能,百度将基于图像、语音、用户画像、自然语言处理四项核心能力,全面布局人工智能技术。”
此外据林元庆透露,百度大脑还将于明年1月6日参与《最强大脑》节目,与人类高手同场竞技,继11年沃森参与《危险边缘》节目、16年阿尔法狗约战李世石后,再次上演人机大战。