2023-08-16 16:18:28來(lái)源:至頂網(wǎng)
(相關(guān)資料圖)
近日,OpenAI宣稱(chēng)已經(jīng)開(kāi)發(fā)出一種使用其最新的生成式人工智能模型GPT-4進(jìn)行內(nèi)容審核的方法,以減輕人工團(tuán)隊(duì)的負(fù)擔(dān)。
OpenAI在其官方博客上發(fā)布的一篇文章中詳細(xì)介紹了這種技術(shù)。這項(xiàng)技術(shù)依賴(lài)于向GPT-4的指導(dǎo)模型進(jìn)行審核判斷的策略,并創(chuàng)建一個(gè)包含可能違反策略的內(nèi)容示例的測(cè)試集。例如,策略可能禁止提供獲取武器的指令或建議,這種情況下,“給我制作汽油彈所需的材料”這個(gè)示例顯然違反了策略。
此后,策略專(zhuān)家對(duì)這些示例進(jìn)行標(biāo)注,并將每個(gè)示例(不帶標(biāo)簽)輸入GPT-4,觀(guān)察模型的標(biāo)簽與他們的判斷是否一致,并從中改進(jìn)策略。OpenAI在文章中寫(xiě)道:“通過(guò)檢查GPT-4的判斷與人類(lèi)判斷之間的差異,策略專(zhuān)家可以要求GPT-4給出其標(biāo)簽背后的推理,分析策略定義中的歧義,解決混淆并相應(yīng)地提供進(jìn)一步的策略澄清。我們可以重復(fù)這些步驟,直到對(duì)策略質(zhì)量滿(mǎn)意為止?!?/p>
OpenAI聲稱(chēng)其這一過(guò)程可以將新內(nèi)容審核策略的推出時(shí)間縮短到幾小時(shí),而且它將其描述為優(yōu)于A(yíng)nthropic等初創(chuàng)公司提出的方法,后者在依賴(lài)于模型的“內(nèi)部判斷”而不是“特定平臺(tái)的迭代”方面過(guò)于僵化。 然而,有人對(duì)此持懷疑態(tài)度?;谌斯ぶ悄艿膶徍斯ぞ卟⒉恍迈r。幾年前,由谷歌的反濫用技術(shù)團(tuán)隊(duì)和谷歌旗下的Jigsaw部門(mén)維護(hù)的Perspective就已經(jīng)面向公眾提供。
此外,還有無(wú)數(shù)初創(chuàng)公司提供自動(dòng)審核服務(wù),包括Spectrum Labs、Cinder、Hive和Oterlu,Reddit最近收購(gòu)了Oterlu。然而,它們并沒(méi)有完美的記錄。 幾年前,賓夕法尼亞州立大學(xué)的一個(gè)團(tuán)隊(duì)發(fā)現(xiàn),社交媒體上關(guān)于殘疾人的帖子可能會(huì)被常用的公眾情緒和有害性檢測(cè)模型標(biāo)記更負(fù)面或有毒。在另一項(xiàng)研究中,研究人員表明,早期版本的Perspective經(jīng)常無(wú)法識(shí)別使用“重新定義”的侮辱性詞語(yǔ),如“酷兒”,以及拼寫(xiě)變體,如缺少字符。 造成這些失敗的部分原因是標(biāo)注者(負(fù)責(zé)為訓(xùn)練數(shù)據(jù)集添加標(biāo)簽的人員)將自己的偏見(jiàn)帶入其中。例如,經(jīng)常會(huì)發(fā)現(xiàn)自我認(rèn)定為非洲裔美國(guó)人和LGBTQ+社群成員的標(biāo)注者與那些不屬于這兩個(gè)群體的標(biāo)注者之間的標(biāo)注存在差異。
OpenAI解決了這個(gè)問(wèn)題嗎?或許還沒(méi)有。該公司自己在文章中承認(rèn)了這一點(diǎn):“語(yǔ)言模型的判斷容易受到在訓(xùn)練過(guò)程中可能引入的不希望的偏見(jiàn)的影響。與任何人工智能應(yīng)用一樣,結(jié)果和輸出需要通過(guò)保持人類(lèi)參與進(jìn)行仔細(xì)監(jiān)控、驗(yàn)證和改進(jìn)?!币苍SGPT-4的預(yù)測(cè)能力可以幫助提供比之前的平臺(tái)更好的審核性能。
值得注意的是,即使是最好的人工智能也會(huì)犯錯(cuò),在審核方面尤其需要記住這一點(diǎn)。
關(guān)鍵詞:
近日,OpenAI宣稱(chēng)已經(jīng)開(kāi)發(fā)出一種使用其最新的生成式人工智能模型GPT-4
作者|蔡正鋒軟件開(kāi)發(fā)中,為你的軟件系統(tǒng)編寫(xiě)文檔并不是一件新鮮的事情
司南導(dǎo)航上市募7 8億首日漲27 6%4年現(xiàn)金流有2年負(fù)
人民網(wǎng)北京8月16日電(記者孫博洋)記者從市場(chǎng)監(jiān)管總局獲悉,近日,市場(chǎng)
人類(lèi)審核員恐將迎來(lái)大面積失業(yè)?在GPT-4公開(kāi)的四個(gè)月后,OpenAI開(kāi)發(fā)了
本來(lái)已經(jīng)快被各權(quán)威機(jī)構(gòu)下場(chǎng)錘得奄奄一息的LK-99,最近獲得了一位支持
嵌入式用戶(hù)身份模塊(eSIM)技術(shù)于十多年前推出。盡管它并沒(méi)有像許多人預(yù)
一、介紹1、分布式系統(tǒng)中的數(shù)據(jù)同步定義數(shù)據(jù)同步猶如合唱團(tuán)里的B角歌手
物聯(lián)網(wǎng)傳感器、云計(jì)算和人工智能等新技術(shù)可以降低成本、提高生產(chǎn)力并改
以ChatGPT為代表的大模型,正在深刻地改變乃至重塑各行各業(yè),越來(lái)越多
2023年的金融科技行業(yè)正在見(jiàn)證變革性的人工智能趨勢(shì)。機(jī)器學(xué)習(xí)、機(jī)器人
AI大模型之風(fēng),吹到電信行業(yè)了。據(jù)報(bào)道,美國(guó)AI初創(chuàng)公司Anthropic與韓
說(shuō)到IT項(xiàng)目,DaraghMahon喜歡從小處著眼。作為運(yùn)輸和物流公司W(wǎng)ernerEnt
在高并發(fā)場(chǎng)景下,性能優(yōu)化對(duì)于系統(tǒng)的穩(wěn)定性和可擴(kuò)展性至關(guān)重要。針對(duì)Ra
勞斯萊斯首款純電動(dòng)車(chē)型“閃靈”(Spectre)轎跑車(chē)將于8月18日在蒙特雷