近日,OpenAI举办春季发布会,推出全新GPT-4o模型,掀起了全球AI大模型领域的新热潮。
作为OpenAI旗下又一个王炸产品,GPT-4o让人机交互更智能。据了解,GPT-4o可接收文本、音频和图像的任意组合作为输入,并实时生成文本、音频和图像的任意组合输出,使ChatGPT能够处理50种不同的语言,同时提高了速度和质量,尤其在音频理解方面表现出色,可以在232毫秒内对音频输入做出反应,平均响应时长也仅有320毫秒,与人类在对话中的反应速度相当,实现了人与AI的“丝滑”对话。
侧重情感陪伴和情绪价值是GPT-4o的另一个特点。OpenAI研究员Mark Chen表示,新模型具有“感知情绪”的能力,能笑、会唱,可以表达情感,还可以处理用户打断它的情况。在OpenAI发布的录播视频中,机器人能够从急促的喘气声中理解“紧张”的含义,并且指导演示人员进行深呼吸。
“感知情绪”的能力天然适配AI陪伴应用的需求。所谓“AI陪伴”,通常指的是利用人工智能技术,特别是自然语言处理和机器学习,来创建能够模拟人类交流和情感互动的虚拟伴侣或助手。这类应用能够与用户进行日常对话,提供社交互动和情感支持,甚至能够成为用户的生活助手,提供长期陪伴。
实际上,在过去一年里,“AI陪伴”一直是人工智能企业们布局的重点领域,在商业变现的层面,“AI陪伴”目前也是消费者最愿意买单的应用场景之一。国联证券研报指出,AI陪伴产品预计中期在游戏、直播、社交用户中逐步破圈,向7亿+泛娱乐用户渗透;长期来看,有望覆盖13亿+泛互联网用户,推动社交关系由“人-人”转化为“人-人/AI”。去年A16Z也曾指出,AI伴侣将是人工智能落地的第一批杀手级应用,能将生成式AI真正带入消费者的日常生活中。
目前,已有众多公司布局了“AI陪伴”赛道。2023年5月,AIGC软件A股上市公司万兴科技(300624.SZ)已率先推出Trumate,这是一款基于多模态技术构建的沉浸式虚拟陪伴聊天应用,融合了AI语音交流、AIGC技术支持的形象装扮定制、个性化人设问题、基于AI Agent推理的个性化剧场、多个AI Agent协同的精彩群聊等多种功能,在虚拟形象、人设、声音等方面设置了更多玩法,具有高沉浸感和娱乐感等特征。
公开信息显示,推出Trumate的万兴科技是中国数字创意软件领域产品覆盖面广、营收体量大、全球化程度高的A股上市公司,也是国内AIGC行业龙头企业以及国内最大的数字创意软件出海企业,在出海领域有着长达20年的经验,业务覆盖200多个国家和地区,全球累计用户超15亿,被视为中国版“Adobe”。
加速布局“AI陪伴”赛道的不止万兴科技。海外,Character.ai, CrushOn,Talkie,Replika等产品早前已出圈,在用户量、营收方面有了较为亮眼的表现,例如Character.ai2023年营收约为1520万美元,证明了该类应用的广阔商业化空间;国内大厂方面,已有腾讯“未伴”、百度“小侃星球”、美团“Wow”等AI聊天类产品;初创企业方面,有消息称,推出了Kimi的月之暗面最近也在做一款名为Ohai AI的AI聊天类产品。
随着GPT-4o的发布,“AI陪伴”赛道鏖战或将更加激烈。类比移动互联网生态演进历程,基础设施的进一步发展是应用繁荣的重要条件,对于AI应用来说,AI底层模型技术的持续迭代,是AI陪伴应用持续发展的一个关键因素。
伴随着多模态技术的深入发展,大模型领域也在不断升级变化,从图文时代1.0加速进入到以音视频多媒体为载体的2.0时代,基于这样的趋势,国内厂商正加快大模型迭代。4月28日,万兴科技旗下国内首个音视频多媒体大模型万兴“天幕”正式公测,该大模型采用了先进的音视频生成式AI技术,具备近百项音视频原子能力,并已在海外规模化商用,其中文字生成视频能力实现不同风格、丰富场景及主题的连贯性,一键生成时长可超60秒。