网易推出超大模型推理引擎EET:超速响应 3秒创作一首歌词

近日,网易旗下AI研究与应用机构网易伏羲推出新一代Transformer推理引擎Easy and Efficient Transformer(简称:EET引擎)。该引擎具有可扩展、性能高、易使用等特点,能够在自然语言处理和多模态领域,有效提升Transformed-based超大模型的推理效率,让AI算法产生更大的社会价值,助力中国在超大模型生态研发领域领先全球。

目前,EET引擎已经应用在网易云音乐、Lofter,以及《逆水寒》、《天谕》等游戏中,在情境对话、语义判别、故事生成、AI作词、AI作曲等场景中发挥效能。

近年来,国内外掀起了对Transformed-based超大模型的研发热潮。Google、OpenAI、华为、微软、NVIDIA等AI巨头纷纷投身其中,在多个领域展开“军备竞赛”。然而,超大模型庞大的参数量带来了巨大的计算压力,处在高速发展期的超大模型生态,急需好用、高效、具有扩展性的推理引擎,来助推工程落地。

技术应用,正是网易伏羲的重点研究方向。据悉,此次推出的EET引擎相当于在超大模型和应用场景之间搭建了一座桥梁,把超大模型的算法成果运用到实际业务中,有效降低响应时间、增强用户体验、提高吞吐量、缓解线上部署压力。

在应用中,EET引擎主要解决两个问题:首先,针对AI线上服务的延迟问题,EET引擎可以在更短的时间内响应用户,提升用户体验。

举例来说,在网易伏羲研发的AI写歌产品中,用户可以通过设定关键词、韵脚、词格、段落属性等信息参数,在AI技术的帮助下,迅速创作一首歌词。由于其中涉及到海量参数的计算,一首歌词的创作大约需要20秒的时间。应用EET引擎的之后,同样一首歌词的创作时间被缩短到了3~4秒,用户体验大大提升。

第二,EET引擎还能降低硬件成本,提升线上模型的吞吐量。简单来说,假如完成一项计算任务需要部署10台服务器,在应用EET引擎之后,只需要2台服务器就能完成相同的任务。

与同类推理引擎相比,EET引擎的加速效果表现出色。在一组与字节跳动推理引擎LightSeq的比较实验中,EET引擎的加速效果在小规模情况下比LightSeq高0.819到1.64倍;在中等模型情况下,EET引擎的加速效果比LightSeq高1.46到2.9倍。


EET在小模型(hidden_units=768, sequence_length=769)的情况下与LightSeq进行比较

EET在中等模型(hidden_units=1024, sequence_length=1024)的情况下与LightSeq进行比较

目前,超大模型的规模已经发展到千亿级别,正在向万亿规模进发。网易伏羲也将进一步优化EET引擎,未来将支持千亿、乃至万亿规模的超大模型,为前沿技术发展和应用提供动力。

网易伏羲成立于2017年,是国内专业从事游戏和泛娱乐产业人工智能研究和应用的顶尖机构。网易伏羲的研究方向包括强化学习、图像动画、自然语言、虚拟人、用户画像、大数据平台、云计算平台、云游戏等领域。在为网易众多产品提供高质量和前沿AI技术的同时,网易伏羲正在进一步把AI技术和产品开放给更多合作伙伴,全面释放创作者的生产力,革新用户体验。

(0)
上一篇 2021年4月29日 17:59
下一篇 2021年4月29日 22:29