前不久,OpenAI发布又一款“王炸”产品Sora,展示了从文生视频、图生视频,再到多机位视频生成的强大能力,再次引爆全球。
事实上,文生视频赛道并非OpenAI最先开始探索。去年末,Runway及Pika引爆AI视频生成赛道,并将热度延续至今。今年以来,除爆火的Sora之外,海外头部厂商谷歌、国内AI应用赛道佼佼者AIGC软件A股上市公司万兴科技(300624.SZ)等也都纷纷发布最新成果。
其中,谷歌与OpenAI同日推出了最新一代多模态大模型 Gemini 1.5 Pro,把稳定处理上下文的上限扩大至100万tokens,创下了最长上下文窗口的纪录。
万兴科技则于1月30日,在长沙马栏山主办多媒体大模型创新应用高峰论坛暨发布签约仪式,面向全球市场重磅发布湖南首个通过算法备案、中国首个音视频多媒体创作垂类大模型——万兴“天幕”。
据介绍,万兴“天幕”依托基础大模型及高性能全球网络平台、计算集群算力平台和海量数据平台,由视频大模型、音频大模型、图片大模型和语言大模型组成,具有“专精特快”优势,可专业提升视频创作效率、精细化提升垂类质量、特色化补齐创作闭环、快速赋能应用智能化升级。
当前,万兴“天幕”多媒体大模型已迭代近百项音视频原子能力,包括文生主题视频、文生3D视频、AI歌手、视频AI配乐、数字人播报等。经测算,万兴“天幕”原子能力多指标数据表现远超行业平均水平。其中,“文生主题视频”支持高质量视频一键生成、“文生3D视频”支持极高自由度的3D场景生成、“AI歌手”提供超逼真的AI歌手翻唱定制服务、“视频AI配乐”支持根据视频内容AI生成匹配的音乐、“数字人播报”仅需普通手机即可操作,人像真实度、口型准确度等均优势明显,且支持全球主流语种。
目前,万兴“天幕”众多能力已在万兴科技旗下创意软件产品,尤其是海外产品中规模化商用。其中,万兴科技旗下视频创意产品Wondershare Filmora 13已全新集成大模型能力,全新版本的AI Copilot智能剪辑助手、AI文字快剪、AIGC音乐生成等功能备受海外用户好评;一站式出海视频营销神器万兴播爆已实现大模型中数字人能力的应用,使AIGC更好地服务于出海视频创作者,并提供领先的AI视频翻译能力。数据显示,在万兴“天幕”的加持下,Wondershare Filmora、万兴播爆等使用AI功能的用户数等多倍速增长,赋能效果显著。
视频生成技术的不断创新和进步,为用户提供了更多创作的可能性,同时也为企业提供了更多的商业机会。随着视频内容的需求不断增加,视频生成赛道也将持续火热。
当然,挑战一直存在,其中视频生成的质量和真实感是关键问题。尽管人工智能技术能够生成逼真的视频,但仍然存在一些细节和效果上的不足。其次,视频生成技术的算法和模型需要不断优化和改进,以提高生成效率和质量。此外,随着视频生成技术的普及,版权和隐私保护等问题也需要得到更好的解决。
随着人工智能技术的不断进步和应用,视频生成技术将在未来继续发展,为用户带来更加丰富多样的视觉体验。我们可以期待在未来会有更多的厂商推出全新的视频生成产品,为用户带来更加丰富多样的视觉体验。