近日,联合图像专家组JPEG公布了JPEG AI标准平台提案结果,火山引擎多媒体实验室凭借软件平台BEE的优异表现,获得主观质量性能评比最佳成绩。
JPEG是国际标准化组织、国际电工委员会和国际电信联盟的工作小组。信息“爆炸”时代,图像压缩对于互联网数据的传输和存储至关重要。得益于深度学习在图像压缩技术上的飞速进展,JPEG AI小组发布了JPEG AI标准平台提案的征集,希望构建全新的智能图像编码系统,在提升图片质量的同时,也能提高压缩性能。
来自世界各地的高校、科研院所、企业等数十家单位,提交了各自的软件平台方案。在相同文件大小的前提下,图像压缩最重要的评价指标是人类的主观视觉感受。此次主观质量性能评比中,火山引擎软件平台BEE优于其他参赛软件平台,名列该项评比的榜首。
据悉,自动驾驶、媒体分发等场景对图像压缩技术有较高的要求,需要在有限带宽的条件下传输更多高质量图片。智能图像编码是人工智能技术在图像压缩上的跨领域应用,在工业应用中具有巨大潜力,是图像压缩的重要发展方向。
火山引擎多媒体实验室负责人表示,BEE软件平台提出了多个创新算法,解决了智能图像编码软硬件实现中的一系列难题,独创的“解耦式熵编码”技术更是化解了长期困扰端到端压缩的数据依赖,使得编解码速度有了根本性提升。
据介绍,业界在智能图像编码过程中,熵编码与像素重建过程是高度耦合的,“这就好像一个力工和一个瓦工配合造房,力工每次给瓦工一块砖,等瓦工抹好水泥砌上并给出收条后,他才会去搬下一块。这在流程上形成了‘耦合’与‘依赖’,会影响造房效率。”
火山引擎“解耦式熵编码”技术打破了这种制约,“力工不用再等瓦工抹水泥,只需要不停地搬砖放到指定位置就可以,甚至可以叫来更多力工一起搬。而瓦工也不用关注力工,只要指定位置有砖,他就可以不停地砌墙,从而大幅提高生产效率”。
图1:JPEG官方主观测试结果图,TEAM16、24为火山引擎的方案
图2:JPEG主观测试DMOS表,TEAM16、24为火山引擎的方案
测试结果表明,BEE平台的解码速度要比其他参赛软件平台高1-3个数量级,其速度已经超过最新的标准H.266/VVC。在图形处理器GPU加持下,BEE平台解码时间仅为H.266/VVC官方参考软件的一半。
火山引擎多媒体实验室是字节跳动旗下的研究团队,致力于探索多媒体领域的前沿技术,参与国际、国内的标准化工作,其众多创新算法已经广泛应用在抖音、西瓜视频等产品的多媒体业务,并向火山引擎的企业级客户提供技术服务。