2023-08-02 13:22:37來源:IT之家
(資料圖)
8 月 2 日消息,荷蘭內(nèi)梅亨大學(xué)近日發(fā)布研究報(bào)告,指出 Meta 和 OpenAI 等公司在使用“開源”術(shù)語時(shí)容易誤導(dǎo)用戶,部分標(biāo)記為“開源”的大語言模型實(shí)際上并非開源的。
該報(bào)告特別提及了 Meta 公司的 Llama 2 模型和 OpenAI 的 GPT / codex 模型,表示訓(xùn)練這些大語言模型的代碼并未向公眾開放。
研究人員表示,當(dāng)前 AI 社區(qū)中,缺乏開源大語言模型問題日益突顯。研究人員呼吁公司發(fā)布更多的開源 LLM,以便研究人員和開發(fā)人員可以訪問代碼并提高這些模型的性能。
OpenAI 的 ChatGPT 模型是最“神秘”的,不符合開源標(biāo)準(zhǔn);而 Meta 的 Llama 2 雖然宣稱是“開源”,但實(shí)際透明度只是稍微優(yōu)于 ChatGPT 模型,在開源排行榜上的程度依然很低。
研究報(bào)告認(rèn)為這些公司主要出于以下幾點(diǎn)原因:
想要保護(hù)自己的知識(shí)產(chǎn)權(quán)想要控制如何使用大語言模型而研究人員和開發(fā)人員在面臨開源大語言模型上存在天然的弱勢(shì),可能無法研究論文結(jié)果、改進(jìn)現(xiàn)有大語言模型的性能。
Meta 的立場(chǎng)是諷刺的,因?yàn)樵摴咀院赖卣f,Llama 2 可用于研究。即便如此,該公司似乎仍將該項(xiàng)目的某些部分鎖定在開發(fā)人員和研究人員之外。
IT之家在此附上論文鏈接地址,感興趣的用戶可以深入閱讀。
關(guān)鍵詞:
8月2日消息,荷蘭內(nèi)梅亨大學(xué)近日發(fā)布研究報(bào)告,指出Meta和OpenAI等公司
本文經(jīng)AI新媒體量子位(公眾號(hào)ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請(qǐng)聯(lián)系出處。
“要深度分析問題原因,不能只統(tǒng)計(jì)數(shù)字,流于表面!”每次寫原因分析類
以三明治為主的連鎖餐廳Subway在全球約有3 7萬家門店,每家門店都面臨
本文經(jīng)AI新媒體量子位(公眾號(hào)ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請(qǐng)聯(lián)系出處。
武漢大學(xué)中南醫(yī)院創(chuàng)傷與顯微骨科醫(yī)生憑借豐富經(jīng)驗(yàn),發(fā)現(xiàn)隱藏在體內(nèi)的皮
維護(hù)國家主權(quán)鋼槍御敵 捍衛(wèi)祖國統(tǒng)一堅(jiān)定不移 今天,“八一”建軍節(jié) 東
游戲中有各種各樣的策略你需要知道。只有知道了策略,才能快速取得游戲
截至8月2日11時(shí)12分,上證指數(shù)報(bào)點(diǎn),下跌點(diǎn),跌%,成交額2323億元;深
物聯(lián)網(wǎng)庫存控制技術(shù)可以改變?cè)O(shè)施管理,提高可見性和效率,同時(shí)減少浪費(fèi)
中國的服務(wù)器虛擬化市場(chǎng)雖然與全球市場(chǎng)存在一些共同特征,但也表現(xiàn)出顯
中國干果食品歷史悠久,由于其特殊的營養(yǎng)保健功能,價(jià)廉物美,數(shù)千年來
時(shí)間來到2023年,《最終幻想》這個(gè)ip已經(jīng)擁有了逾16部作品和眾多難以計(jì)
哈嘍,大家好。今天給大家分享下GPT-4codeinterpreter自動(dòng)做數(shù)據(jù)分析、
一個(gè)分層架構(gòu)設(shè)計(jì)的應(yīng)用通常包含很多個(gè)邏輯層(LogicalLayer)和物理層(P