界面新闻记者|查沁君
教育公司也“卷”入了大模型浪潮中。
7月26日,网易有道(NYSE:DAO)正式对外发布国内首个教育领域垂直大模型“子曰”,并推出基于“子曰”大模型研发的六大应用——“LLM翻译”、“虚拟人口语教练”、“AI作文指导”、“语法精讲”、“AIBox”以及“文档问答”。
目前,AIBox和文档问答已经在有道翻译中上线,口语教练、作文辅导和语法精讲下月初搭载在新学习硬件上线,大模型翻译将在今年三季度上线。
大语言模型诞生于2018年,谷歌的BERT是最早模型,自去年11月ChatGPT将大模型产品化后,它开始展示巨大的革命性力量,一时间,大模型成为全新风口,国内外巨头相继涌入。
“每个月、每个星期都刷新行业对AI技术未来可能性的想象。”网易有道CEO周枫在发布会现场表示。过去半年,其团队也在持续进行产品研发和迭代,并推出一系列小规模用户实验。
在他看来,大模型给教育领域带来的最大机会,就是助力因材施教,包括以下三大关键机会:
第一,个性化分析和指导。大模型具有强大的生产能力,且能进行定制化的反馈,比如面对一道作文题,大模型在理解题目含义后,可给出写作指导,也可以对学生的写作进行个性化的反馈。
第二,引导式学习。通过不断提问,让学生培养自我学习的能力,提高批判化思维。
第三,全学科教学。通过掌握海量知识,从而实现跨学科的搜索和语言生成能力。
相比通用大模型,“子曰”大模型的定位是以“场景为先”的教育垂类大模型。作为基座模型支持诸多下游任务,向所有下游场景提供语义理解、知识表达等基础能力。
发布会现场,有道词典业务负责人与虚拟人口语教练Echo进行了对话,Echo能根据对话者的发言和对上下文的理解,及时反馈。对话结束后,Echo还会给出发音、语法等建议。
周枫在群访中坦言,对这位口语教练“寄予厚望”,毕竟其背后指向的是口语陪练这个百亿市场。该项目采取会员付费制,较真人口语教练花费更低。
AI口语陪练并非新事物,大模型出现以前,就已有大量相关产品,基于大模型的虚拟人口语陪练有何不同?
“以前AI口语陪练产品所给出的对话,是基于提前设定的模板,AI基于模板进行微调,给出对话内容。”网易有道首席科学家段亦涛在群访中解释,大模型的生成能力更强,并具有了一定的推理能力。
不仅如此,周枫还透露:“内部调研中,‘子曰’大模型的翻译能力已经优于ChatGPT、超过了市面上所有主流翻译引擎。”
但“子曰”大模型翻译目前仅支持中英文互译,尚未开发其他语种。“很重要的原因是大模型引擎的计算量大,比原有引擎贵20倍。”周枫称。
这指向了大模型背后的一个关键问题,即投入产出比和商业化。
相比接入通用大模型,自研模型在数据采集和处理、训练资源和时间、算法和模型架构、模型评估和调优上,所耗费的成本和资源是一笔不小的账单。如果不能有效完成商业化,则很难收回成本,后续的迭代、更新、升级更是难题。
恰逢近日Meta宣布将推出开源大型语言模型Llama2,免费用于研究和商业用途。这意味着,企业和个人可以在Llama2的基础上以较低的成本开发自己的专属大模型。
“这也是我们内部非常关心的问题,我们非常拥抱开源。”周枫在群访中称,“但我们做AI的重点,永远是盯着最后的应用落地。”之所以选择自研,也是因为现有模型暂时不能满足需求,尤其是像语法、答疑等深度需求。不排除“哪一天开源项目很成熟,我们也会用”。
周枫还认为,世界上大部分的大模型都将会免费,因为其边际成本非常低,复制模型其实不需要成本。商业公司会从多个角度推动大模型免费、开源,比如为了增强公司影响力、构建生态,或者纯粹为了惠及公众。
在这趟由大模型驱动的新一轮“AI技术快车”上,网易有道并非唯一的教育企业。
在国外,可汗学院、多邻国(NASDAQ:DUOL)、Chegg(NYSE:CHGG)等教育机构相继宣布推出接入GPT-4的学习辅助工具,且有一定的商业化考量。
以多邻国推出的新产品“DuolingoMax”为例,Max订阅服务收费30美元/月、168美元/年,目前仅限于iPhone平台,主要面向学习西班牙语和法语的英语用户。
在国内,和网易有道一样,好未来(NYSE:TAL)瞄准的也是垂类大模型,并利用自身基因和资源强项,研发数学大模型MathGPT,预计于年内推出基于该自研大模型的产品级应用。
周枫也提到研发数学大模型的难点所在,“数学光喂内容没用,因为它是原理问题,现有技术没法做到套一下就能使用(的地步)。”相反,如果是文字语言型的应用,不需要特别强的推理。
近日,美国研究人员评估了ChatGPT模型在不同时期版本的表现能力,发现GPT-3.5和GPT-4的某些性能正在变差,尤其是GPT-4求解数学问题的能力,GPT-4在3月表现出的97.6%准确率到6月降至2.4%。
科大讯飞(002230.SZ)也于近期对外展示其自研的“星火认知大模型”,明确将通用AI大模型的能力推向学习机、录音转写工具“讯飞听见”等产品,上线了中英文作文类人批改、数学类人互动辅学、英语类人口语陪练等功能。
6月初,作业帮也传出消息,称其研发的教育大模型在内测阶段,正在进行相关评估及备案等工作。
无论是教育垂类大模型的研发,还是通用大模型在教育领域的落地,都并非易事,不仅需要强大的技术实力,还需要雄厚的资金投入。对于尚处早期的大模型来说,跑通商业模型尚需时日,这也意味着,教育企业在相当长的一段时间内还难获得回报。