ALL in 大模型,好未来能否迎来“好未来”

刚从国内科技互联网公司的“大模型全民开放”风波中回过神来,好未来又上阵了……

在近日举办的好未来20周年直播活动中,CTO田密正式宣布好未来自研大模型MathGPT上线并开启公测。根据官方介绍,MathGPT是好未来自主研发,面向全球数学爱好者和科研机构,以解题和讲题算法为核心的大模型。

更早之前,7月26日,网易有道也发布了教育领域垂直大模型“子曰”,以及基于此的六大应用——“LLM翻译”“虚拟人口语教练”“AI作文指导”“语法精讲”“AI Box”“文档问答”;5 月 6 日,科大讯飞正式发布了讯飞星火认知大模型及应用成果。

不难发现,无论是好未来还是其它教育行业参与者,都在跑步与“大模型”融合。毕竟,低迷的市场需要他们搞出“新花样”。

那么,“深谙此道”的好未来,能凭借MathGPT抢先“录取”吗?

MathGPT内测:因材施教并非“题库捞真”

就目前而言,大语言模型赛道是大模型企业普遍发力点。因此,当大模型之家看到,好未来官网放出远胜GPT4对比的数据截图之时,还是为之一振。

大模型之家随机进行内测申请,并成功通过审核。至于MathGPT到底行不行?且看大模型之家对于它的实测。

MathGPT的界面很清晰,用户可根据自身需求按小学、初中和高中三个学段进行选择,且不同学段提供了相应的示例,题目类型涵盖计算题、应用题、代数题等多个类型。

同时,在输入端,MathGPT支持中英文切换,用户只需点击“中文/EN”按钮便可完成;除了普通文本外,其还支持公式格式以及图像(带有数字和文字)形式的输入。

值得一提的是,MathGPT还具有各种数学符号快捷输入功能,用户只需在输入框中点击“公式编辑”符号即可。

此外,MathGPT还上线了“随机来一题”的功能,用户只需点击此按钮,系统就能随机生成数学题目并给出解答。

是骡子是马,拉出来遛遛。大模型之家首先输入了一道小学推理题进行“试水”。

即:“味多美的草莓甜心,第一天卖出了全部的一半儿,第二天卖出剩下的一半儿,还剩6块儿,味多美共有多少个草莓甜心?”

大约30秒,MathGPT便给出了答案。答案之外,其还提供了“分析”、“详解”、“点睛”另外三个部分。

这其中,“分析”主要用以提供题目解题思路、逻辑方式,以便让用户更好地理解题目;“详解”则给出具体计算方式和答案;最后“点睛”的环节,则是十分全面地对题目所含考点、关键点等进行着重梳理提示,帮助用户从出题意图方向反思、达到举一反三的目的。可以说,在大模型之家的首次尝试中,MathGPT表现得还是可圈可点的。

完成首题测试后,大模型之家仅仅将题干的数字进行了修改,以便更好地测试MathGPT举一反三的能力。不过,这次的MathGPT却让人大跌眼镜,不仅将原始题干的出题逻辑解读的一塌糊涂,甚至最后的结果也相当离谱,信马由缰地写下了大片错误的解答过程。

值得注意的是,考虑到小学阶段教学具有“高重复”特征。因此大模型之家选择在3分钟后“重复”输入了上述题目。

然而,同样的等待时间、同样的题目,MathGPT却给出了一个更加令人瞠目结舌的答案。

MathGPT的回答,可能并不能达到“因材施教”的预期,甚至无法稳定地提供正确的答案。

常见的文字问答之外,大模型之家又选取了一道初中证明题,进行了图片题干输入。不过,结果并不尽人意,MathGPT,得出了一个“驴唇不对马嘴”的结论。同时,其不仅对图片分辨率及清晰度的要求相当高,稍有差池就无法识别;甚至产生的答案解法也由英文表述,最终答案与出题意图更是“背道而驰”。

值得一提的是,大模型之家将同样的问题交给于MathGPT很早之前问世的百度搜题后,百度搜题仅用时不到一分钟就得出了正确结论。可见,在图片输入功能上,MathGPT还有太多需要完善的地方。

一位公立小学的数学老师告诉大模型之家:数学语言“千姿百态”且十分抽象。因此,想让MathGPT完全理解题意,联系上下文更是难如登天。同时,随着学段的增加,试题不仅要基于“规定”的数学原理,还要时刻落实到课标上,而基于数据产生的MathGPT自然无法给出正确答案。

大模型之家认为,MathGPT的数学能力十分薄弱,仅仅掌握了十分基础的“数学公式”及“常见真题”。总体表现呈重复性、图片输入功能缺陷较多,甚至有“摆设”嫌疑。因此,相较于“AI实现因材施教”,“AI数学大题库”的称号似乎更为合适。

大模型,难为好未来的解药

事实上,瞄准大模型的好未来,过得并不好。

根据7月发布的2024财年第一季度未经审计财务报告来看,截至今年5月31日(好未来财务年度结束日期为2月28日),好未来2024财年一季度净收入由上一财年同期2.24亿美元上升至本季的2.75亿美元,归属于好未来的净亏损为4504万美元,净亏损金额较上年同期略有扩大。

再往前追溯,2020财年至2023财年,好未来的净利润均为亏损且亏损金额逐年扩大。再结合此次新财年数据来看,这一情况并未有显著好转。

大模型,在好未来的眼中,似乎成为了用以“治疗”亏损的解药。

好未来总裁兼首席财务官彭壮壮在财报中强调:本季度好未来在调整核心产品和提升运营效率的同时,也在以智能硬件为代表的新业务上取得进展。

表面上来看,好未来自身实力强劲,不仅在2017年就布局了AI lab人工智能实验室,还具有强大的“专业化”基础。同时,作为唯一一家人工智能“国家队”成员,好未来深耕AI领域多年,构建了面向教育的人工智能算法能力、应用解决方案、基础软硬件体系和开源开放服务的国家教育科技创新平台。

据公开资料显示:好未来AI lab获得各类顶级学术会议比赛冠军16项,亚军6项,发表国际期刊和会议高水平学术论文近百篇。

值得关注的是,在推动大模型标准体系建设中,好未来也先后作为核心单位参与了由国家人工智能标准化总体组组织的大模型系列国家标准、中国信通院牵头编制的“大模型预训练模型技术和应用评估方法”系列团体标准,以及教育部教育信息化技术标准委员会暨全国信息技术标准化技术委员会主导的“教育通用大模型”系列标准编制工作。

然而,尽管转型路径十分清晰,但大模型带来的考验也仍不容小觑。

首先是老生常谈的资金问题。作为教培巨头,好未来自2020财年起陷入亏损泥潭,从账面资金来看,截至2023年5月31日,好未来现金、现金等价物和短期投资合计余额为30.45亿美元,较三个月前(2023年2月28日)减少了1.27亿美元。这意味着,在现金流承压的现状下,好未来短期内无法“心无旁骛”的投入到大模型赛道中。

其次,虽然得益于前期的积累,好未来拥有较为庞大的用户“基础”,但其目前的智能教育硬件仅有学习机和讲题机两条核心产品线,PC端应用量十分有限。加之,行业内不乏科大讯飞在内的“人工智能教育参与者”,好未来的“突围”将更加困难。

更长远来看,即便学习机及讲题机为MathGPT找到了应用落地之处,但随着MathGPT与二者的绑定销售,MathGPT的“只言片语”都将影响到学习机及讲题机的销量。

此外,现阶段的大模型狭义上仍旧被认为是大语言模型,且结合MathGPT的目前表现来看,的确处于“题库搜题”初期。一位在线教育从业人员告诉大模型之家:大模型的相关研究有很多,但现阶段还停留在在线教育的基础技术助手及工具上。可见,MathGPT是否成立,仍要受到适配场景外和技术水平的制约。

“双减”落地两年,如今的好未来似乎正进入一场生死局。它麻烦未解,却又瞄准了黄金热点。大模型之家认为,对于眼下的MathGPT来说,如何在保证“用户为本”的前提下,快速找到商业化落地方式,成为其亟待解决的难题。

更长远来看,随着AIGC、大模型等技术的不断升级,如何在引入AI的同时,推动旗下产品

不断进化升级,为用户提供更加智能化、全面化的学习助力,使教育赛道产生颠覆级的变革才是每一个“AI+教育”企业长久发展的关键。

(0)
上一篇 2023年9月12日 11:38
下一篇 2023年9月12日 13:33