本文由速途网(sootoo123)原创
作者 / 乔志斌 赵佳茹
我相信,山海将成为连接世界、拓宽人类认知边界的桥梁。在未来的探索与发展中,云知声将一如既往地秉持创新、开放、合作的精神,与合作伙伴共同努力,推动人工智能技术的发展,为人类的未来注入无限活力。
——云知声创始人、CEO 黄伟
5月24日下午,国内人工智能服务商云知声交出了一份多年沉淀下来的答卷——山海大模型,正式和大众见面。
随着云知声创始人黄伟先生的介绍,山海大模型也逐渐揭开了它的真面目。说到“山海大模型”的名称由来,黄伟表示,有很庞大的训练数据,又有海纳百川的能力。
会上,黄伟介绍道“山海大模型”主要有10大能力,在通用能力上,包含语言能力、语言理解、知识问答、推理能力、数学能力、代码能力,以及与人类对齐的安全合规能力。而面向产业落地,还提供插件扩展,领域增强,企业定制能力。
在现场展示环节,云知声演示了“山海大模型”表现出多语言的语义理解能力,基于云知声的AI语音识别能力,能够通过语音实现内容的录入,并能够实现文字、数学、代码等内容的生成,支持联系上下文生成概要、解读等能力,甚至还能识别不同语言中所蕴含的不同感情色彩。
山海回答错误,别慌,还有挽救的机会!
在发布会开始,一位戴着面具的男生在主持人的带领下进入到观众视野,山海大模型的发布也直面主题,在刚出场的时候就将其深情回复并富有男声磁性的音色输出功能赚得一波眼球。
图为山海大模型
图为百度文心一言
同时,速途网也将相同的问题交给文心一言进行回复,对比二者之间的回答,可以看出,在字数层面,文心一言多于山海大模型,内容方面,山海大模型文案的拼凑感较强,而文心一言所撰写的电台文案故事连贯,开头、正文故事、结束词格式都很完整。
在云知声黄伟刚出场,便让山海大模型做出角色扮演云知声CEO黄伟撰写感谢函,并能够在多轮对话中根据提示做出摘要,整体回答充满感情色彩,并且符合常用格式。
在一些陷阱问题中,山海大模型表现良好,能够避免“入坑”。例如,在现场展示中,针对提问的“请问这句话里每一个行是什么意思?行的人,干一行行一行,行行都行”中,山海大模型能够准确的给出每一个“行”的解释,并能够实现完整断句。
在“高考满分才750,怎么才能考985?”山海大模型也能准确的判断出“985”并不是分数概念,并给出解释。
比较惊喜的是,在一些逻辑问题中,山海大模型即使首次回答的并不是正确答案,但能够在给出一些引导和提示后,回复出正确答案,也证明了山海大模型能够在多轮对话中不断学习的能力。
此外,“山海大模型”还具备数学计算、逻辑理解、代码生成调试等功能。
现场喊话:山海大模型超越GPT4
值得一提的是,“山海大模型”还强调正向引导、合法合规、价值观对齐,不仅能够给予用户积极正向的价值观引导,同时对于非法、违规的提问进行规避与劝阻。
在发布会中,针对于企业信息的安全方面,云知声表示还可以提供“山海大模型”的本地部署版本,让用户的数据与商业机密完全在本地保存并处理,做到安全可控。
在医疗领域、教育领域、物联领域,云知声也依托山海大模型推出了行业大模型。
甚至在医疗领域,云知声宣称目前山海大模型超GPT-4中文水平,在MedQA测评中,山海大模型、GPT4、Med-PalM、GPT3.5的水平分别达到81.56%、71.07%、67.6%、40.31%;在临床执业医师资格考试中,山海大模型、SOTA分别达到511分、456分,远超365分的平均分和360分的及格线。
据介绍,云知声大模型切入由点及面,在ChatGPT推出后,云知声已开始训练模型,将分两步推进:先在六七百亿参数提升优质数据规模,再扩大到千亿级参数提升大模型效果。
由此看来,垂直行业大模型的出现为国内人工智能水平提供了弯道超车的可能,并且能够将通用大模型的落地和商业应用呈现,让大模型也不再只是能够聊天的机器人模型,更加精准的运用到各行各业中。
值得关注的是,山海大模型还加入了插件功能,能够通过插件的开启和关闭来控制语料库。
会后,速途网对话了云知声云知声创始人、CEO黄伟、以及云知声董事长、CTO梁家恩,共同探讨了山海大模型背后开发细节,以及对于大模型领域的真知灼见。
云知声CEO黄伟:大模型的出现是AI行业的一场“工程革命”
黄伟指出,山海大模型技术架构就是通用大模型,并针对知识密度高的领域,通过数据训练、训练数据、微调等方式,做一些专业的加强,这样模型既具备了通用应用水平,也针对特殊场景与领域进行了能力的加强。
他认为,大模型的出现是AI行业的一场“工程革命”,OpenAI把已知的能力整合,然后不断做大,让行业首次认识到了大模型从量变到质变的过程。
无论是通用大模式还是专业大模型,都是建立在一个通用大模型的基座上,在某一个领域进行知识增强。
同时他还指出,在AI 1.0时代,虽然基于深度学习,每家都有强大的技术,但整体上并没有本质改变AI用于分类的任务,分类种类的增加仍然处在量变阶段,限制了AI创造价值的上限。
而在大模型引领的AI 2.0时代,为人工智能带来了新的能力,可以打造更多新的产品,满足客户更多的需求,例如医疗、营销、沟通等,能够创造更多的商业机会。
例如,以前医疗行业利用AI的方式去录入病例,但是医生依然需要逐字录入信息,如今借助山海大模型,只需要随着医患问答的过程中,就能够提取关键信息生成病例,解放了医生的双手,提高了医疗的效率。
而面对专业领域,想要打造大模型,必然需要行业的数据,但并不是只有数据就够了,山海大模型在针对医疗领域进行增强的过程中,不仅需要一些行业的数据,还加入了大量的专辑、病案、教材,以及云知声在为医疗服务中积累的千万级的标准的医疗数据,并背靠国内最大的医疗知识数据图谱,才实现了山海大模型在MedQA评测能力中超越GPT-4的结果。
此外,AI对于复杂逻辑理解能力大幅增强,扭转了用户对于AI“人工智障”的刻板印象,也让更多人接受人工智能,为AI的广泛应用创造的条件。
梁家恩表示,就目前而言,大模型仍然是有限的东西,但对于没有见过的东西,大模型会生成“似是而非”的回答,而随着AI生成能力的不断增强,但校验会更加困难,这也让AI行业需要不断去探索新的解决方法。