盘古Chat来袭,华为产业链能否迎风翻盘?

2023年伊始,继国内百度文心一言、商汤日日新SenseNova大模型体系、以及阿里巴巴通义千问、科大讯飞星火大模型等相继发布之后,华为也加入AI大模型的行列。

近日,有媒体报道称,华为公司即将推出一款名为”盘古Chat”的多模态千亿级大模型产品,直接与ChatGPT进行竞争。

有资料显示,盘古大模型于2020年11月在华为云内部立项成功,对于盘古大模型定位,华为内部团队确立了三项最关键的核心设计原则:

一是模型要大,可以吸收海量数据;

二是网络结构要强,能够真正发挥出模型的性能;

三是要具有优秀的泛化能力,可以真正落地到各行各业的工作场景。

随着国内多家企业相继推出类ChatGPT大模型,华为为了展示自己的大模型领域的积累,“盘古Chat ” 也即将问世。消息称,“盘古Chat ”预计将于今年7月7日举行的华为云开发者大会 (HDC.Cloud 2023) 上对外发布并开启内测,其产品主要面向To B / G市场,即政企端客户。

首个千亿参数中文预训练大模型

盘古Chat将打破人工智能“语言霸权”

公开资料显示,目前华为“盘古系列AI大模型”基础层主要包括NLP大模型、CV大模型、以及科学计算大模型等,上层则是与合作伙伴开发的华为行业大模型。

今年4月,在人工智能大模型技术高峰论坛上,华为云人工智能领域首席科学家田奇曾分享了“盘古大模型的进展及其应用”。他表示,盘古NLP大模型覆盖的智能文档检索、智能 ERP、小语种大模型等落地领域,2022年华为刚交付了一个阿拉伯语的千亿参数大模型。在应用方面,盘古大模型可以应用于智能客服、机器翻译、语音识别等多个领域,提供AI技术支持。

根据华为公布的一份论文数据显示,华为盘古PanGu-Σ大模型参数最多为1.085万亿,基于华为自研的MindSpore框架开发。论文中表示,PanGu-Σ大模型在对话方面的整体表现可能已接近GPT-3.5的水平。

自然语言处理(NLP)的技术演进和应用一直是最热门的赛道。然而,在AI演进的过程中,英语作为世界通用语言,占据了这个领域优势地位。就如同GPT3,英文占比为92.7%、法语1.8%、德语1.5%而中文语料只占0.1%。这意味着,英文之外的语料匮乏,会导致使用这些语种的国家在发展AI大模型的过程中遭遇更多阻力。

据介绍,盘古Chat是首个千亿参数中文预训练大模型,其中CV大模型则首次达到30亿参数的规模。华为官方表示,盘古CV大模型业界最大CV大模型、首次实现兼顾判别与生成能力,并在ImageNet上展现出领先的小样本学习能力;盘古气象大模型提供秒级天气预报;紫东·太初是全球首个图、文、音三模态大模型。

盘古大模型作为一款具有超大规模参数的产品,相比一般的大模型训练成本更高。但值得注意的是,大模型的参数量,并不意味着与其在语言处理方面的准确度和质量成正比。而在公开资料中,盘古大模型在语义理解方面仍存在一定的局限性,特别是处理复杂语言结构和语义推理方面。

大模型之家认为,中国发展大模型是形势所需,国内企业需要加强自主创新,掌握核心技术,避免被外部势力“卡脖子”,提升国家的竞争力和影响力。不过,目前市场上推出的大模型存在严重的趋同性,且多以“类ChatGPT”的形式亮相,因此华为盘古Chat能否通过自身的量变引起质变,仍然需要等到7月正式问世后才能得出结论。

入局大模型赛道

华为产业链能否迎风翻盘?

AI将进一步驱动各行各业的生产能力、生产效率从量变到质变,实现跨越式发展,而随着华为盘古Chat的推出,这也对计算提出了新要求。

与其他厂商相比,华为的优势或在于拥有完整的产业链和较强的算力调配能力。据浙商证券此前披露,在训练千亿参数的盘古大模型时,华为团队调用了超过2000块的昇腾910芯片,进行了超2个月的数据训练能力。

华为公司作为国内科技企业标杆,在AI芯片、算力等方面坚持国产化,其中,昇腾全栈AI软硬件平台构筑智能世界的基石,昇腾计算产业生态不断发展完善,为盘古大模型提供了底层算力支撑。

然而,在AI算力领域,英伟达具有绝对优势,旗下算力卡不仅成为了人工智能企业的香饽饽,甚至面对供货的封锁,甚至不惜加价购买英伟达显卡。而面对美国制裁,华为的AI芯片开发与生产被迫停滞。

华为内部称,每年大模型训练调用GPU/TPU卡超过4000片,3年的大模型算力成本高达9.6亿元人民币。

图源:东吴证券

在华为盘古大模型产业链上,多家上市公司都与华为保持着深度合作。在盘古Chat正式发布后,相关公司有望从中受益。

值得注意的是,盘古大模型由NLP大模型、CV大模型、多模态大模型、科学计算大模型等多个大模型构成,通过模型泛化,解决传统AI作坊式开发模式下不能解决的AI规模化、产业化难题,可以支持多种自然语言处理任务,包括文本生成、文本分类、问答系统等。

此外,在应用方面,盘古大模型可赋能多个行业,如智能舆情,智能营销,智能巡检,智慧物流等多种场景。

不过,由于“盘古Chat”主要面向政企端客户,大模型之家推测,盘古Chat应该不会大规模开放使用,通过强调功能的定制化,以及部署的数据安全性探索政企市场。这或将意味着华为的“盘古Chat”需要更多依赖华为现有的合作伙伴体系去推广,通过与现有合作伙伴的深度合作,华为可以利用其合作伙伴的渠道和市场资源,可能需要更多时间去经历市场验证和达成行业共识。

随着国内越来越多的人工智能企业正在积极探索大模型的应用,可以预见的是,在AI发展红利的驱动之下,将不断强化我国在大模型领域的核心竞争力,并提升我国在数据安全方面的治理能力,为我说实现数字化转型和智能化发展提供有力支持。

(0)
上一篇 2023年6月5日 20:20
下一篇 2023年6月6日 10:15