人人妻人人澡人人爽人人精品av_精品乱码一区内射人妻无码_老司机午夜福利视频_精品成品国色天香摄像头_99精品福利国产在线导航_野花社区在线观看视频_大地资源在线影视播放_东北高大肥胖丰满熟女_金门瓶马车内剧烈运动

首頁(yè)>國(guó)內(nèi) > 正文

OpenAI提出使用GPT-4進(jìn)行內(nèi)容審核的新方法

2023-08-16 16:18:28來(lái)源:至頂網(wǎng)


(相關(guān)資料圖)

近日,OpenAI宣稱(chēng)已經(jīng)開(kāi)發(fā)出一種使用其最新的生成式人工智能模型GPT-4進(jìn)行內(nèi)容審核的方法,以減輕人工團(tuán)隊(duì)的負(fù)擔(dān)。

OpenAI在其官方博客上發(fā)布的一篇文章中詳細(xì)介紹了這種技術(shù)。這項(xiàng)技術(shù)依賴(lài)于向GPT-4的指導(dǎo)模型進(jìn)行審核判斷的策略,并創(chuàng)建一個(gè)包含可能違反策略的內(nèi)容示例的測(cè)試集。例如,策略可能禁止提供獲取武器的指令或建議,這種情況下,“給我制作汽油彈所需的材料”這個(gè)示例顯然違反了策略。

此后,策略專(zhuān)家對(duì)這些示例進(jìn)行標(biāo)注,并將每個(gè)示例(不帶標(biāo)簽)輸入GPT-4,觀(guān)察模型的標(biāo)簽與他們的判斷是否一致,并從中改進(jìn)策略。OpenAI在文章中寫(xiě)道:“通過(guò)檢查GPT-4的判斷與人類(lèi)判斷之間的差異,策略專(zhuān)家可以要求GPT-4給出其標(biāo)簽背后的推理,分析策略定義中的歧義,解決混淆并相應(yīng)地提供進(jìn)一步的策略澄清。我們可以重復(fù)這些步驟,直到對(duì)策略質(zhì)量滿(mǎn)意為止?!?/p>

OpenAI聲稱(chēng)其這一過(guò)程可以將新內(nèi)容審核策略的推出時(shí)間縮短到幾小時(shí),而且它將其描述為優(yōu)于A(yíng)nthropic等初創(chuàng)公司提出的方法,后者在依賴(lài)于模型的“內(nèi)部判斷”而不是“特定平臺(tái)的迭代”方面過(guò)于僵化。 然而,有人對(duì)此持懷疑態(tài)度?;谌斯ぶ悄艿膶徍斯ぞ卟⒉恍迈r。幾年前,由谷歌的反濫用技術(shù)團(tuán)隊(duì)和谷歌旗下的Jigsaw部門(mén)維護(hù)的Perspective就已經(jīng)面向公眾提供。

此外,還有無(wú)數(shù)初創(chuàng)公司提供自動(dòng)審核服務(wù),包括Spectrum Labs、Cinder、Hive和Oterlu,Reddit最近收購(gòu)了Oterlu。然而,它們并沒(méi)有完美的記錄。 幾年前,賓夕法尼亞州立大學(xué)的一個(gè)團(tuán)隊(duì)發(fā)現(xiàn),社交媒體上關(guān)于殘疾人的帖子可能會(huì)被常用的公眾情緒和有害性檢測(cè)模型標(biāo)記更負(fù)面或有毒。在另一項(xiàng)研究中,研究人員表明,早期版本的Perspective經(jīng)常無(wú)法識(shí)別使用“重新定義”的侮辱性詞語(yǔ),如“酷兒”,以及拼寫(xiě)變體,如缺少字符。 造成這些失敗的部分原因是標(biāo)注者(負(fù)責(zé)為訓(xùn)練數(shù)據(jù)集添加標(biāo)簽的人員)將自己的偏見(jiàn)帶入其中。例如,經(jīng)常會(huì)發(fā)現(xiàn)自我認(rèn)定為非洲裔美國(guó)人和LGBTQ+社群成員的標(biāo)注者與那些不屬于這兩個(gè)群體的標(biāo)注者之間的標(biāo)注存在差異。

OpenAI解決了這個(gè)問(wèn)題嗎?或許還沒(méi)有。該公司自己在文章中承認(rèn)了這一點(diǎn):“語(yǔ)言模型的判斷容易受到在訓(xùn)練過(guò)程中可能引入的不希望的偏見(jiàn)的影響。與任何人工智能應(yīng)用一樣,結(jié)果和輸出需要通過(guò)保持人類(lèi)參與進(jìn)行仔細(xì)監(jiān)控、驗(yàn)證和改進(jìn)?!币苍SGPT-4的預(yù)測(cè)能力可以幫助提供比之前的平臺(tái)更好的審核性能。

值得注意的是,即使是最好的人工智能也會(huì)犯錯(cuò),在審核方面尤其需要記住這一點(diǎn)。

關(guān)鍵詞:

相關(guān)新聞

Copyright 2015-2020   三好網(wǎng)  版權(quán)所有 聯(lián)系郵箱:435 22 [email protected]  備案號(hào): 京ICP備2022022245號(hào)-21