谁能成为下一个iOS？学而思们涌入教育大模型赛道

2023-08-23 13:54:20 来源：壹零社爱科学小 中

当教育硬件遇到大模型，一个真正属于教育领域的“iPhone 时刻”或将到来。拥有数据抓取、分析和优化能力的大模型们，对于一种教育平板的意义更像是iOS于iPhone，为平板注入“灵魂”的同时，也开启了一个全新的学习时代。

011

(相关资料图)

强势崛起的教育硬件

“平板卖不动了，学习机却卖疯了”——这句话成为当下教育硬件市场的写照，即便在外形、功能上平板电脑与学习机非常类似，但教育内容及系统的搭载，让这些平板电脑摇身一变成为消费市场新的宠儿。

来自市场研究机构Canalys的数据显示，2023年第一季度，全球平板电脑出货量同比下滑18%。另一家研究机构IDC的数据同比降幅更是超过了19%。而在中国市场，IDC的数据显示，2023年第一季度，中国平板电脑市场出货量同比下降约1.1%。其中，商用市场同比下降12.7%，消费市场则同比去年持平。市场大呼：“平板卖不动了。”

消费市场的稳健很大程度上来自学习类平板的快速增长。洛图科技的数据显示，2023年第一季度，中国消费级智能平板市场出货量为583.3万台，同比下跌5.9%。但学习类产品表现亮眼，今年一季度销量排名TOP 6的品牌小度、步步高、科大讯飞、好记星、希沃和小猿，全部实现了销量大涨。弗若斯特沙利文数据显示，中国智能学习设备的复合年增长率为17.1%，到2026年其总市场规模将达到1450亿元。

高速成长的市场引来众多玩家，在学习机这一品类上，大致可以氛围步步高、读书郎为代表的传统学习硬件厂商，以科大讯飞、小度、网易有道为代表的科技公司和猿辅导、作业帮等拥有教育内容的公司。随着入局玩家的增多，这一赛道已经呈现白热化的竞争态势，产品形态也趋于同质化，除在产品硬件规格上角力外，更在内容、系统上开启全方位、立体化的战役。

021

教育硬件的iPhone时刻

从小霸王学习机、步步高点读机到网易词典笔，每个时代的学生记忆中都有一份关于教育硬件的烙印，而“双减”推动K12教育企业转换赛道的过程中，教育硬件成为重要的领域。

新一代智能硬件中，最先火起来的智能教育硬件，要算网易有道的智能词典笔，以及科大讯飞的智能学习机了。伴随着网易有道以及科大讯飞教育硬件产品的成功，网易有道以及科大讯飞两家上市公司，也在其核心业务之外获得了较快的发展。

而随着教育硬件赛道的逐渐成形，猿辅导、学而思、新东方等机构也开始布局智能硬件赛道，相对于单纯兜售“硬件+学习资源包”的做法，猿辅导、学而思们凭借多年积淀下来的教育内容资源，成功构建“软件+硬件+服务”的闭环服务，进而在众多教育硬件中脱颖而出。

尤其是2023年2月，国内首个对话大模型 MOSS 推出并开源后，教育领域一众头部厂商也争相抢滩研发大模型，打造产品级应用，并率先落地于教育智能硬件中，一场全新的教育竞赛就此展开——

·5月，科大讯飞发布星火认知大模型及应用成果，明确将通用AI大模型的能力推向学习机T20。录音转写工具“讯飞听见”等产品，上线了中英文作文类人批改、数学类人互动辅学、英语类人口语陪练等功能。在今年的618大促中，科大讯飞AI学习机系列获得京东和天猫双平台学习机品类销售额冠军。

·6月初，作业帮也传出消息，称其研发的教育大模型在内测阶段，正在进行相关评估及备案等工作。

·7月，网易有道推出国内首个教育领域垂直大模型[子日]，并于8月9日发布首款落地硬件产品——有道词典笔 X6 Pro，成为教育垂类大模型在教育智能硬件的首次落地。

“大模型 + 教育智能硬件”开启一个全新的学习时代，大模型让教育智能硬件不仅仅能够实现作业批改、疑题解答等常规应用，更重要的是大模型能够通过源源不断的题库及用户学习数据，真正做到精准查漏补缺，可以更加有针对性地学习，掌握的知识快速过，薄弱的知识精细学，减少无用功，对症下药更快更好地提升成绩。从这里看，教育大模型完全可以扮演好“AI老师”的角色，进而推动在线教育平台的类人化辅导转型。

031

从MathGPT到“子曰”

教育大模型应该是怎样的？从细分到综合，不同的企业有着不同的想法和实践。

学而思目前正在进行自研数学大模型的研发，命名为MathGPT，其面向全球数学爱好者和科研机构，以数学领域的解题和讲题算法为核心，目前已经取得阶段性成果，并将于年内推出基于该自研大模型的产品级应用。

在学而思研发团队眼里，大语言模型（LLM）更像是文科生，行业内偏向基于LLM大模型做阅读、写作类应用，但如果想要在数学能力上有突破，就需要研发新的大模型。因此，学而思决心组建团队钻研MathGPT——数学领域大模型，用自己在数学和AI上的多年积累，面向全球范围内的数学爱好者和科研机构，做好AI大模型时代的数学基础工作。

学而思希望通过MathGPT弥补和攻克大语言模型的三个问题：第一，题目要解对，现在GPT结果经常出现错误；第二，解题步骤要稳定、清晰，现在GPT的解题步骤每次都不一样，而且生成内容经常很几余：第三，解题要讲的有趣、个性化，现在GPT的解释过于“学术”和机械，对孩子的学习体验很不友好。

在大模型数学应用领域，目前市场上有几个主要流派。比如Google收购的Photomath、微软数学.Mathway、专注数学计算的WolframAlpha等产品，主要利用非LLM的传统AI技术加上数据库的方式解决数学问题。

走AGI路线的公司则尝试让通用LLM“更懂数学”，比如GPT4在数学任务上比之前的3.5版本性能更好，谷歌旗下的Minerva模型也专门针对数学问题进行调优。学而思选择了另一条少有人走的路，不基于现有LLM做微调和接口调用、不做通用LLM而是自研基于专业领域的“数学大模型”MathGPT，致力于打造自主、稳定、可持续、高质量的学习解决方案。

当然，专注数学并不意味着放弃综合赛道，学而思学习机近期将会上线一款“AI助手”，涵盖作文助手、口语助手、阅读助手、数学助手等相关功能，该AI产品目前正处于内测阶段。

相较学而思MathGPT，网易“子曰”大模型就更像是实力强大的文科生了，其支持“LLM翻译”“虚拟人口语教练”“AI作文指导”“语法精讲”“AI Box”以及“文档问答”等多个应用场景，可以面向不同用户群体采取不同的对话风格。向小学生介绍万有引力的概念时，大模型能够抓住核心概念，在小学生常识的基础上进行科普，同时，文本的语言风格轻松活泼，适合低龄的学生。同样一个问题场景变为大学生时，模型对概念的解释更加专业全面，并提供了与概念相关的公式和例子，满足大学生对专业知识的需求。

而在进行数学和物理能力测试时，大模型并不是直接给出答案，而是将公式先列出来，在对文本进行数据提取后将数据代入公式中得出正确的答案。并且，大模型能够理解和支持多轮对话，在数学题中用“一个足球”提问后，在随后的物理题中用“这个球”进行指代，模型可以理解指的是同一个小球。

两条路线明显各有千秋，不过类似大模型的引入，对整个教育智能硬件行业的改变却是非常明显的。目前市场上的智能教育硬件产品大多都是用硬件形态对原来教培内容进行装载，本质上仍然是这些企业在“卖课程”。但是大模型接入智能硬件后，这些智能教育硬件可以结合学生实际学习情况，为学生推荐适合的难度目标，真正做到了“千人千面”的定制化服务。

当然，大模型从研发、训练到推出，都需要庞大的资金、资源支持，即便是当年强势无比的在线教育平台，目前除了学而思计划推出自研大模型，其余像Quizlet、多邻国、可汗学院、高途等在线教育平台都是接入其他公司的通用大模型。然而通用大模型并非适配所有场景，但它会是非常好的平衡之选。

041

加速开辟细分赛道的大模型

自OpenAI发布ChatGPT以来，海内外厂商都加速布局基础大模型的研发，所有大模型的训练都分为两步：首先通过预训练形成基础模型，然后针对特定领域做微调。通过这种过程，原则上来说只要有细分领域数据，大模型就可以针对垂直领域做优化，赋能各行各业。

目前国内基础大模型百花齐放，多家厂商已陆续推出大模型并开始用于自身业务或寻找行业伙伴进行落地，成为Base Model（基础模型）可赋能万物，拥有极大的空间。

应用落地首先要依赖大模型的基础能力，因此一方面大模型厂商将致力于提升大模型的基础能力，积累的训练经验对于模型能力提升尤其重要，同时训练经验还可以极大降低预训练新行业模型的以及模型落地新场景微调的成本。

另一方面除了大模型本身的差异，需要竞争的就是具体落地方案，在各应用场景落地解决方案的积累，可以帮助厂商更好地满足行业客户的具体需求，同时还可能对于类似客户形成规模效应。未来积累了丰富经验的厂商，将对应用行业可以提供一站式的解决方案，全方位满足客户需求。

除了基础大模型，许多大模型厂商都致力于推出各类行业大模型。实际应用并不一定需要大模型具有非常全面的能力，而更需要对行业知识的理解和对行业需求的适配，在具体行业上，行业大模型的泛化等能力往往要优于基础大模型+微调。而在阿里通义大模型、百度文心大模型的推动下，通用模型同各细分赛道数据结合，以通用大模型算法研发及训练平台底座，完全有机会在金融、医疗、办公等各细分赛道上孵化出各种行业大模型产品。