2023-08-08 10:24:21來源:極客網(wǎng)
大模型風起云涌,正在從虛擬世界進入現(xiàn)實世界。谷歌DeepMind日前推出 Robotic Transformer 2(簡稱RT-2)大語言模型,讓人類可以通過純語言命令優(yōu)化機器人控制,邁出了重要一步。
(資料圖片)
不同于此前的大模型,這是一個“視覺-語言-動作”(vision-language-action,簡稱VLA)模型。業(yè)界認為,谷歌此舉是想打造可以適應人類環(huán)境的通用機器人,類似于機器人瓦力或者C-3PO。
谷歌RT-2無需針對特定任務專門訓練
當人類需要學習某項任務時,往往會通過閱讀和觀察來實現(xiàn)。RT-2有點類似,它用到了大語言模型(也就是驅動ChatGPT的技術)。RT-2從網(wǎng)上尋找文本和圖片,然后訓練模型,即使沒有針對特定任務專門訓練過,RT-2也可以識別模式和動作。
舉個例子,按谷歌的說法,在沒要經(jīng)過特別訓練的前提下,RT-2可以識別并扔掉垃圾。RT-2會理解垃圾是什么,了解如何處理,然后完成一系列動作。RT-2甚至知道食品包裝紙或香蕉皮也是垃圾。
谷歌工程師甚至說,向RT-2下達一條命令,讓它撿起已經(jīng)滅絕的動物,RT-2機器人可以從三個雕像中找出恐龍。
放在以前,如果想讓AI處理垃圾——無論是識別垃圾、撿起垃圾還是扔掉,都要專門訓練。RT-2不太一樣,它從網(wǎng)絡數(shù)據(jù)中獲得大量知識,已經(jīng)知道垃圾是什么,能夠識別垃圾,不需要專門訓練。
又比如要讓AI機器人撿起蘋果,先要訓練機器人,讓它知道蘋果的一切,比如蘋果是如何生長的,它的物理特點有什么;不只如此,還要在環(huán)境中識別蘋果,不能將蘋果和紅球混淆;還有最重要的,AI要知道如何將蘋果撿起來。
谷歌RT-2是打造通用機器人的一大步
一般來說科學家會用大量人工獲取的數(shù)據(jù)點來訓練機器人AI,為了覆蓋每一種可能場景,訓練時會消耗大量時間和成本?,F(xiàn)實世界紛繁多變,機器人助手如果想變得實用,必須正確應對那些不太可能編程的場景。
在開發(fā)RT-2時,DeepMind深入挖掘變形AI模型的優(yōu)點,這種模型擁有很強的概括能力。RT-2借鑒了谷歌早期開發(fā)的AI,比如PaLI-X和PaLM-E。有了RT-2模型,機器人可以處理攝像頭圖像,對應該執(zhí)行的動作進行預測。
谷歌發(fā)現(xiàn),如果是訓練過的任務,RT-2試驗6000多次后效果便與RT-1一樣好。如果是沒有訓練過的任務,RT-2的表現(xiàn)比RT-1好一倍。簡單來說,谷歌認為RT-2在學習新場景新任務時表現(xiàn)更好,雖然它仍不完美。
DeepMind的目標是打造通用機器人,但谷歌也承認還有很多研究工作要做,不過RT-2應該是正確的研究方向。如果RT-2真的能變得完美,人類可以向機器人下達“文字命令”,讓機器人按指令行動。
谷歌RT-2可以像人類一樣將學到的知識用于新場景
RT-2最大的突破在于,它從網(wǎng)絡數(shù)據(jù)中學習基本概念和構想,然后將學到的知識用來指揮機器人完成動作,讓機器理解甚至“說出”它們的操作語言。
要讓機器人在多變的環(huán)境中執(zhí)行通用任務,它必須管理好復雜抽象任務。如果是之前沒有遇到的過的環(huán)境,更是需要機器人正確應對。
聊天機器人純粹在虛擬世界運行,機器人不一樣,它存在于真實世界。機器人要理解抽象概念,在實際、物理環(huán)境中應用。
在RT-2出現(xiàn)之前,機器人依賴復雜系統(tǒng)堆棧來運行,也就是高級推理系統(tǒng)與低級操作系統(tǒng)聯(lián)合作戰(zhàn),讓機器人正常運轉,這種方法有些笨重!RT-2簡單一些,它將復雜推理與動作輸出整合到一個模型。
RT-2的最大特點在于:它從語言和視覺訓練數(shù)據(jù)中學習概念,將概念變成機器人動作,即使是之前沒有訓練過的任務,它的處理能力也更強。簡言之,RT-2可以像人類一樣,將以前學到的概念應用于新場景。
谷歌的研究似乎在告訴人類,AI正在以更快的速度影響機器人。開發(fā)多功能通用型機器人是人類的一個夢想,希望RT-2能帶來突破。(小刀)
關鍵詞:
大模型風起云涌,正在從虛擬世界進入現(xiàn)實世界。谷歌DeepMind日前推出Ro
嗨,有時間嗎?夕陽這么好,不如和我去城市的街頭走一走罷!今天放空,
在距離天津市區(qū)140多公里的薊州區(qū)馬伸橋鎮(zhèn)邦博家庭農(nóng)場,農(nóng)場主劉愛博
針對當前暑期以中小學生為主體的研學游市場火爆的實際,北京市文化市場
今天來聊聊011nba總決賽頒獎,2011nba總決賽錄像的文章,現(xiàn)在就為大家
同花順數(shù)據(jù)中心顯示,博遷新材8月7日獲融資買入751 54萬元,占當日買入
斯巴魯LEVORGLayback預告圖將于9月發(fā)布日前,斯巴魯汽車發(fā)布了旗下LEVO
臨沂今日天氣今天是8月8日,星期二,農(nóng)歷六月廿二。晴轉多云,東北風2
8月7日北向資金增持3 98萬股西部創(chuàng)業(yè)。近5個交易日中,獲北向資金減持
今天小魚來為大家解答以上問題,滿江紅,劇情解析很多人還不知道,現(xiàn)在
北京通州發(fā)布(bjtzfb)北京城市副中心官方微信通州小布(北京通州發(fā)布
看來,華盛頓口中的“國家安全”在很大程度上就是要擊敗中國,在技術和
周邊房價近30000元 ㎡!南通主城燙金地塊計劃出讓,三中施教區(qū)!,路東,
海正生材將于2023年8月16日解禁2484 15萬股,占總股本比例12 26%,解禁
北京商報訊(記者張君花)8月7日,報喜鳥發(fā)布公告稱,公司副總經(jīng)理兼董