2023-08-24 15:25:09來源:機器之心
國內(nèi)大模型市場又迎來了一個新的「選手」,這次是數(shù)學(xué)專用大模型。
8 月 24 日,機器之心獲悉,在好未來 20 周年直播活動中,CTO 田密宣布好未來自研的數(shù)學(xué)領(lǐng)域千億級大模型 MathGPT 正式上線并開啟公測。即日起,用戶可通過官網(wǎng)申請注冊賬號免費試用體驗。
今年 5 月,好未來曾公布正在進行自研數(shù)學(xué)大模型的研發(fā),命名為 MathGPT。MathGPT 是面向全球數(shù)學(xué)愛好者和科研機構(gòu),以解題和講題算法為核心的數(shù)學(xué)垂直領(lǐng)域的大模型,也是國內(nèi)首個專為數(shù)學(xué)打造的大模型。
【資料圖】
使用方式也很簡單。用戶使用 MathGPT 時,用文字或圖片方式上傳數(shù)學(xué)題,即可得到對話式的解答反饋,也可以通過 “隨機來一題” 的按鈕,隨機生成數(shù)學(xué)題目并由系統(tǒng)給出解答。
目前,MathGPT 支持中文、英文版本的 PC 端和移動端體驗。
領(lǐng)先的數(shù)學(xué)解題能力MathGPT 匯集了好未來多年教育教研數(shù)據(jù)積累,專注于數(shù)學(xué)領(lǐng)域。千億級大模型的訓(xùn)練、推理、部署框架,為模型賦予了強大能力。通過優(yōu)質(zhì)教育數(shù)據(jù),實現(xiàn)題目計算、講解、問答等多任務(wù)持續(xù)訓(xùn)練和有監(jiān)督微調(diào),呈現(xiàn)出卓越表現(xiàn)。此外,借助人類反饋對齊,還將進一步提升模型綜合素養(yǎng)。MathGPT 在解題準(zhǔn)確率、穩(wěn)定性及用戶體驗方面均有明顯的優(yōu)勢。
據(jù)了解,MathGPT 的數(shù)學(xué)計算能力已覆蓋小學(xué)、初中、高中的數(shù)學(xué)題,題目類型涵蓋計算題、應(yīng)用題、代數(shù)題等多個類型,還可以針對題目進行追問。不過暫未開放數(shù)學(xué)之外的問答互動。
MathGPT 技術(shù)報告
具體效果如何呢?在 CEval-Math、AGIEval-Math、APE5K、CMMLU-Math、高考數(shù)學(xué)和 Math401 等 6 個公開數(shù)學(xué)評測集合的測試結(jié)果中,MathGPT 取得了多項測試的最高分?jǐn)?shù)。同時,MathGPT 在 C-Eval 的初高中的全科測試集合上也均有不錯的表現(xiàn)。
MathGPT 在 C-Eval 榜單初高中各科成績
此外,在解題穩(wěn)定性、講解友好度方面,MathGPT 基于海量名師解題過程的數(shù)據(jù)進行模型訓(xùn)練,模型的解題步驟專業(yè)清晰。
我們以一道數(shù)列題為例,MathGPT 給出的答案包含 “分析”、“詳解”、“點睛” 三個部分,比通用大模型的粗略講解方式更為細(xì)致。其中“分析” 提供了題目的解題思路、思考方式,幫助用戶更好地理解題目;“詳解” 則給出具體的計算方式和答案;最后 “點睛” 的環(huán)節(jié)對題目的考點、難點、關(guān)鍵點進行提示,幫助用戶回顧反思出題意圖、舉一反三。
對于使用者而言,研究數(shù)學(xué)問題不僅在于得到答案本身,更在于答案背后的解題原理、思路邏輯。與其他通用大模型相比,MathGPT 能實現(xiàn)更高準(zhǔn)確度的解題,也能把答案解析得更清楚、講解得更明白,更好地滿足用戶使用 AI 產(chǎn)品解答數(shù)學(xué)問題的核心需求。
在 MathGPT 發(fā)布同時,好未來也更新了一個具有代表性和挑戰(zhàn)性的數(shù)學(xué)任務(wù)評測集,供全球人工智能專家、數(shù)學(xué)愛好者體驗和測評。好未來希望讓 MathGPT 在數(shù)學(xué)教育領(lǐng)域發(fā)揮更大作用,并愿意把基于大規(guī)模、高質(zhì)量的內(nèi)容的千億級大模型研發(fā)經(jīng)驗方法和業(yè)內(nèi)分享,和行業(yè)共同進步。
好未來 AI 的厚積薄發(fā)在 AI 浪潮的推動下,今年以來多家科技公司宣布推出通用大語言模型產(chǎn)品,而好未來選擇了另一個方向,不基于將現(xiàn)有大語言模型做微調(diào)和接口調(diào)用、不做通用大語言模型,而是深入數(shù)學(xué)的垂直領(lǐng)域研發(fā)大模型,致力于打造自主、穩(wěn)定、可持續(xù)、高質(zhì)量的數(shù)學(xué)解決方案。
通用大模型 “重文輕理”,在數(shù)學(xué)問題的解決、講解、問答和推薦方面則存在明顯的短板。而在另一個層面,在通往通用人工智能的路上,數(shù)學(xué)推理能力很重要,全球有很多大型公司在做這方面的研究。
“好未來在數(shù)學(xué)的數(shù)據(jù)和業(yè)務(wù)上有 20 年的積累,有大量的教育數(shù)據(jù)的積累和持續(xù)生產(chǎn)教育數(shù)據(jù)的能力,所以選擇做這個難而正確的事情?!?田密稱,好未來希望用自己在數(shù)學(xué)和 AI 上的多年積累,做好 AI 大模型時代的數(shù)學(xué)基礎(chǔ)工作。
其實早在 2017 年,好未來便成立了 AI lab 人工智能實驗室?;谥腔劢逃斯ぶ悄荛_放創(chuàng)新平臺助力,好未來 AI lab 獲得各類頂級學(xué)術(shù)會議比賽冠軍 16 項,亞軍 6 項,發(fā)表國際期刊和會議高水平學(xué)術(shù)論文近百篇。
2019 年,科技部宣布依托好未來建設(shè)智慧教育國家新一代人工智能開放創(chuàng)新平臺,好未來成為教育行業(yè)首批唯一一家人工智能 “國家隊” 成員,在人工智能領(lǐng)域有多年深入研究。多年來,好未來以教育行業(yè)重大需求為牽引,構(gòu)建了面向教育的人工智能算法能力、應(yīng)用解決方案、基礎(chǔ)軟硬件體系和開源開放服務(wù)的國家教育科技創(chuàng)新平臺。
好未來也在積極參與推動大模型標(biāo)準(zhǔn)體系建設(shè),先后作為核心單位參與了由國家人工智能標(biāo)準(zhǔn)化總體組組織的大模型系列國家標(biāo)準(zhǔn)、中國信通院牽頭編制的 “大模型預(yù)訓(xùn)練模型技術(shù)和應(yīng)用評估方法” 系列團體標(biāo)準(zhǔn),以及教育部教育信息化技術(shù)標(biāo)準(zhǔn)委員會暨全國信息技術(shù)標(biāo)準(zhǔn)化技術(shù)委員會主導(dǎo)的 “教育通用大模型” 系列標(biāo)準(zhǔn)編制工作。
近期,好未來正作為牽頭單位與中國信通院、復(fù)旦大學(xué)、科大訊飛、百度等行業(yè)領(lǐng)先科研機構(gòu)、高校、企業(yè)一同編制教育大模型團體標(biāo)準(zhǔn),從覆蓋場景、應(yīng)用成效、服務(wù)可靠等維度全面評估教育大模型能力,為教育大模型應(yīng)用落地提供參考與指導(dǎo)。
用 AI 實現(xiàn)大規(guī)模因材施教隨著大語言模型的興起,如何用 AI 技術(shù)服務(wù)各行各業(yè)是社會關(guān)注的焦點。教育行業(yè)是最早開始布局 AI 領(lǐng)域的行業(yè)之一,AI 能為教育生態(tài)帶來何種變化一直備受關(guān)注。
“AI 帶來了重新定義教育行業(yè)的機會,大模型技術(shù)使得大規(guī)模的因材施教真正有了實現(xiàn)的可能。” 田密介紹,20 年來,好未來一直在探索個性化學(xué)習(xí),從線下小班到線上大班,再到 AI 課,形式不斷進化,但教的內(nèi)容始終是固定的、學(xué)生和老師互動較少、顆粒度只能到題目級別。
田密認(rèn)為,大模型的本質(zhì),是一種更高效的、從數(shù)據(jù)中學(xué)習(xí)知識并加以應(yīng)用的方式。在 AI 能力的加持下,“學(xué)生自學(xué) + AI 答疑” 的新型學(xué)習(xí)方式成為廣泛的可能。學(xué)習(xí)者獲得優(yōu)質(zhì)教學(xué)內(nèi)容的門檻、成本降低,獲得的教學(xué)內(nèi)容個性化、精細(xì)化程度持續(xù)升高,可以實現(xiàn)千人千面的 AI 教學(xué)和答疑輔導(dǎo),每個學(xué)生都能得到最適合自己的學(xué)習(xí)內(nèi)容。
以 MathGPT 為基礎(chǔ),好未來將不斷探索 AI 環(huán)境下的學(xué)習(xí)方式,更好地服務(wù)于全球的學(xué)習(xí)者、數(shù)學(xué)愛好者,并將經(jīng)驗及時與行業(yè)分享,通過 AI 技術(shù)助力教育科技的積極改變。
隨著公測的順利進行,MathGPT 的解題能力將得到持續(xù)提升,基于 MathGPT 的產(chǎn)品級應(yīng)用也正在加速研發(fā)中,將于近期發(fā)布。
關(guān)鍵詞:
國內(nèi)大模型市場又迎來了一個新的「選手」,這次是數(shù)學(xué)專用大模型。8月2
中國網(wǎng)財經(jīng)8月24日訊今日,科創(chuàng)板塊走強。截至14時30分,昱能科技(6883
你能談?wù)効梢娦栽诠芾碓瓢踩械淖饔脝?為什么它是當(dāng)今CISO面臨的重大
在過去的十年里,AI系統(tǒng)發(fā)展的速度令人驚嘆。2016年AlphaGo在圍棋比賽
GPT-4多模態(tài)能力恐怕是要再等等了。近日,來自CMU的研究人員全新提出了
逆水寒手游游戲的不同副本中都有著不同的Boss需要玩家挑戰(zhàn),其中很多玩
近年來,中國超大規(guī)模云提供商面臨著來自全球和本土其他云提供商的激烈
2023年8月份開始,已退休人員的養(yǎng)老金按照新標(biāo)準(zhǔn)發(fā)放,不少地區(qū)已開始
在Oracle數(shù)據(jù)庫中,初始化參數(shù)是非常重要的配置項,它們直接影響數(shù)據(jù)庫
盡管數(shù)字化轉(zhuǎn)型計劃的獨特目標(biāo)和細(xì)節(jié)必須由公司的技術(shù)和業(yè)務(wù)領(lǐng)導(dǎo)層制定
AI區(qū)別于傳統(tǒng)軟件的一個基本特征是它的非確定性。即使使用相同的輸入,
WiFi自26年前誕生以來已經(jīng)走過了漫長的道路。最初,它支持2 4GHz的2Mbp
關(guān)于既有住宅增設(shè)電梯提取住房公積金的通知各有關(guān)單位:為進一步發(fā)揮住
1 介紹虛擬號是一種基于互聯(lián)網(wǎng)技術(shù)的電話號碼服務(wù)。它通過將電話號碼與
概述樓宇自動化控制系統(tǒng)改變了我們管理和控制建筑物各種功能的方式,從