2023-08-28 13:28:07來(lái)源:新智元
當(dāng)?shù)貢r(shí)間8月26日,馬斯克親自上線開啟了一場(chǎng)FSD Beta V12試駕直播,引百萬(wàn)人現(xiàn)場(chǎng)圍觀。
(資料圖片)
據(jù)稱,F(xiàn)SD Beta V12是有史以來(lái)第一個(gè)端到端AI自動(dòng)駕駛系統(tǒng)(Full AI End-to-End),是特斯拉最重要的一次升級(jí)。
直播45分鐘,F(xiàn)SD Beta V12系統(tǒng)在行駛?cè)踢M(jìn)展非常順利,能夠輕松繞過(guò)障礙物,識(shí)別道路各種標(biāo)志。
馬斯克激動(dòng)地表示:
V12系統(tǒng)從頭到尾都是通過(guò)AI實(shí)現(xiàn)。我們沒(méi)有編程,沒(méi)有程序員寫一行代碼來(lái)識(shí)別道路、行人等,全部交給了神經(jīng)網(wǎng)絡(luò)。
具體來(lái)說(shuō),V12的C++代碼控制減少了10倍,從2萬(wàn)多行減少到2千行。
獨(dú)特的地方在于,特斯拉99%的決策都交給神經(jīng)網(wǎng)絡(luò)給出,視覺(jué)輸入,控制輸出,就像人類大腦一樣。
另外,它所擁有的超強(qiáng)能力,是經(jīng)過(guò)巨量的「視頻數(shù)據(jù)」、1萬(wàn)個(gè)H100加持下完成的。
不過(guò),直播中,V12出現(xiàn)僅有一次的小失誤,試圖闖過(guò)紅燈,讓人類去主動(dòng)干預(yù)。馬斯克現(xiàn)場(chǎng)來(lái)了個(gè)緊急剎車。
馬斯克表示,F(xiàn)SD Beta V12仍在調(diào)試中,因此還沒(méi)有確定正式發(fā)布的時(shí)間。
馬斯克:我們沒(méi)有編程馬斯克這場(chǎng)實(shí)時(shí)直播,出發(fā)點(diǎn)是特斯拉總部。
馬斯克單手開啟特斯拉Model S后,全程45分鐘,自己舉著手機(jī)錄下V12的行駛?cè)獭?/p>
馬斯克在地圖上隨機(jī)選擇了一個(gè)目的地——斯坦福??纯碫12是如何帶他去往第一個(gè)目的地。
行駛中,馬斯克稱,特斯拉遇到的這些建筑、道路標(biāo)志,是從未見(jiàn)過(guò)的。雖然離總部很近,但是對(duì)其來(lái)說(shuō)還是新事物。
走到交叉路口時(shí),特斯拉主動(dòng)停了下來(lái),并耐心等待信號(hào)燈變化。
馬斯克笑著調(diào)侃道,它做到了!
綠燈后,特斯拉平穩(wěn)地進(jìn)行了左轉(zhuǎn)。
馬斯克表示,這完全是通過(guò)人工智能和攝像頭實(shí)現(xiàn)的,就如同我們大腦運(yùn)作方式一樣,對(duì)應(yīng)之為神經(jīng)網(wǎng)絡(luò)和眼睛。
遇到減速帶時(shí),V12讓汽車緩慢行駛。
馬斯克激動(dòng)地稱,沒(méi)有一行代碼讓特斯拉,在停車標(biāo)志處停車,或等待另一輛車,沒(méi)有「等待x秒」之類代碼。這都是神經(jīng)網(wǎng)絡(luò),除了神經(jīng)網(wǎng)絡(luò)什么也沒(méi)有。
說(shuō)著說(shuō)著,第一個(gè)目的地斯坦福到了。馬斯克還是惦記著和小扎來(lái)場(chǎng)籠斗,因此第二個(gè)目的——小扎的家。
然后,他輸入了小扎家的地址,讓V12加持的特斯拉帶路。
路上,特斯拉繞著一個(gè)環(huán)形交叉路口行駛時(shí),V12再次展示了頂級(jí)水平。
在等待前兩輛車開走后,然后決定轉(zhuǎn)彎行駛。
這里,馬斯克再次重申道,團(tuán)隊(duì)從未對(duì)環(huán)形交叉路口的概念進(jìn)行編程。我們剛剛向它展示了一堆關(guān)于環(huán)形交叉路口的視頻。
簡(jiǎn)之,V12是通過(guò)大量的視頻訓(xùn)練數(shù)據(jù)來(lái)實(shí)現(xiàn)這一目標(biāo)。
FSD AI現(xiàn)在只輸入大量視頻,以便識(shí)別在不同情況下需要做什么,而不是對(duì)每個(gè)道路元素或情況進(jìn)行單獨(dú)編碼。
這使得特斯拉能夠省去FSD V12中的數(shù)十萬(wàn)行代碼,使其更加輕便、更靈活,同時(shí)它仍然可以在不熟悉的地形上無(wú)需數(shù)據(jù)連接的情況下工作。
馬斯克介紹,所有這些都是在Tesla HW3上完成的,推理計(jì)算功率約為100瓦。所有推理無(wú)需網(wǎng)絡(luò)連接,在本地進(jìn)行。顯然這是必要的,如果沒(méi)有互聯(lián)網(wǎng)連接,你就無(wú)法安全駕駛。
停車后,馬斯克還談到了特斯拉的幀率。
我們正在以全幀率運(yùn)行。8個(gè)攝像頭以每秒36幀的速度進(jìn)行拍攝。純AI版本比「普通軟件和人工智能混合」的版本運(yùn)行得更好更快。
事實(shí)上,它的拍攝速度將超過(guò)每秒36幀,只是攝像頭只能達(dá)到36 fps。據(jù)我們推算,它可能以每秒50幀的速度拍攝,實(shí)際路況基本上只需要每秒24幀,F(xiàn)SD V12就可以正常工作。
小扎的家到了,馬斯克沒(méi)有下車,反而轉(zhuǎn)身決定去下一個(gè)目的地Palo Alto。
直播中,馬斯克還展示了V12到達(dá)目的地后,自動(dòng)將車停到合適的位置。
「視頻數(shù)據(jù)」直接訓(xùn)AI馬斯克曾表示,F(xiàn)SD V12將成為4級(jí)自動(dòng)駕駛系統(tǒng)。
在今年6月底,馬斯克就宣稱,Tesla的自動(dòng)駕駛FSD V12版本將不會(huì)再是測(cè)試版。
直播演示中,馬斯克也提到了對(duì)于通過(guò)AI訓(xùn)練視頻數(shù)據(jù)來(lái)實(shí)現(xiàn)自動(dòng)駕駛這個(gè)方向可能面對(duì)的挑戰(zhàn)。
「僅僅因?yàn)闆](méi)有代碼行并不意味著它不可控?,F(xiàn)在只需擁有數(shù)據(jù),你仍然可以實(shí)現(xiàn)控制。」
首先是,訓(xùn)練視頻的質(zhì)量非常重要,所以只能用優(yōu)秀司機(jī)的駕駛視頻來(lái)訓(xùn)練,而不能用技術(shù)不好的司機(jī)的數(shù)據(jù)。
當(dāng)前,已經(jīng)有相當(dāng)多的軟件可以實(shí)現(xiàn)選擇什么數(shù)據(jù)、訓(xùn)練什么數(shù)據(jù)。
所以數(shù)據(jù)量不重要,數(shù)據(jù)的質(zhì)量才是提供安全自動(dòng)駕駛技術(shù)的關(guān)鍵。
對(duì)于汽車來(lái)說(shuō),能夠運(yùn)行的軟件很小,但后端訓(xùn)練的軟件要大得多,更加復(fù)雜。
因此,V12系統(tǒng)使用了Python的普通軟件來(lái)決定從隊(duì)列中選擇哪些數(shù)據(jù),然后確定什么是高質(zhì)量數(shù)據(jù),什么是相當(dāng)好的數(shù)據(jù)。
一旦有了AI模型,還可以將這些模型以「影子模式」(shadow mode)傳送到系統(tǒng)上,然后每次它與用戶所做的事情不一致時(shí),特斯拉都會(huì)得到數(shù)據(jù),這比僅僅收集隨機(jī)數(shù)據(jù)更有價(jià)值。
用V12的FSD可以識(shí)別人像,只要傳一張照片,然后告訴汽車你在星巴克門口。車到了之后會(huì)找到你,接你上車。因?yàn)樗梢宰詣?dòng)找到星巴克,然后根據(jù)照片找到乘客。
馬斯克表示,我們實(shí)際上對(duì)系統(tǒng)擁有一個(gè)非常快速的良性循環(huán)反饋感到興奮。
當(dāng)人類對(duì)汽車進(jìn)行干預(yù)時(shí),干預(yù)行為就會(huì)自動(dòng)上傳,訓(xùn)練與訓(xùn)練相結(jié)合,然后實(shí)際上只是更新權(quán)重。
在V12的編程中,特斯拉團(tuán)隊(duì)并沒(méi)有加入交通信號(hào)燈概念,而存在于V11的普通堆棧中。
汽車能夠流暢行駛,主要是基于視頻訓(xùn)練。
「我們已經(jīng)從V11的顯式控制堆棧中的超過(guò)300,000行C++進(jìn)行了轉(zhuǎn)換,而在V12中基本上沒(méi)有這些內(nèi)容」。
還有一個(gè)有趣的困難是,對(duì)于停車問(wèn)題,因?yàn)槿祟愒谟龅酵\嚇?biāo)識(shí)時(shí)不會(huì)真的停下來(lái),只會(huì)降到很低的速度,大概只有不到1%的駕駛員會(huì)完全讓車停下來(lái)。
但是監(jiān)管機(jī)構(gòu)要求必須完全停下來(lái),這樣就必須專門訓(xùn)練FSD在這些情況下完全停車。
直播中唯一一次干預(yù),是由于搭載了V12系統(tǒng)的Modle S在遇到紅燈時(shí)并沒(méi)有停下來(lái)。
對(duì)此,馬斯克現(xiàn)場(chǎng)表示,我們只需要再多喂一些包含大量交通信號(hào)燈的視頻,問(wèn)題就能解決了。
未來(lái)兩周,特斯拉將會(huì)發(fā)布在后臺(tái)運(yùn)行的Shadow Moon,能夠?qū)π旭偁顩r進(jìn)行檢查。
另外,馬斯克提到這套系統(tǒng)有一個(gè)問(wèn)題是如何應(yīng)對(duì)低能見(jiàn)度的駕駛條件。
因?yàn)樘厮估诳偛考又輳牟幌掠?,所以需要世界各地各種天氣條件的駕駛視頻進(jìn)行訓(xùn)練。
目前,F(xiàn)SD V12在全球有12名試駕人員,遍布新西蘭、泰國(guó)、挪威和日本等地。
1萬(wàn)個(gè)H100訓(xùn)練,Infiniband比GPU還缺他還在試駕直播之前串進(jìn)了WholeMars的Space,和里面的開會(huì)的網(wǎng)友聊了10多分鐘,為自己的直播預(yù)熱。
網(wǎng)友看到他進(jìn)來(lái)了,就不自覺(jué)地開始采訪他,他也順勢(shì)打開了話匣子,和網(wǎng)友聊了聊自己馬上要進(jìn)行的直播和相關(guān)的問(wèn)題。
首先他說(shuō)特斯拉已經(jīng)馬上要上線由10000塊H100組成的GPU集群,來(lái)訓(xùn)練新版本的FSD系統(tǒng)。
現(xiàn)在訓(xùn)練過(guò)程基本上都要全完依賴英偉達(dá)的GPU,只有很少一部分會(huì)使用自己的超算Dojo。
而目前他們遇到的最大技術(shù)困難是需要像Infiniband那樣的高速網(wǎng)絡(luò)連接來(lái)并行更大的算力。
GPU雖然短缺,但是至少有改善的希望,但是現(xiàn)在支持Infiniband設(shè)備短缺比GPU的短缺還嚴(yán)重。
大規(guī)模密集型的計(jì)算集群之間的數(shù)據(jù)交換會(huì)很困難。
而對(duì)于英偉達(dá)的依賴會(huì)持續(xù)很長(zhǎng)的時(shí)間。
聊著聊著,馬斯克又不自覺(jué)地進(jìn)入了地球球長(zhǎng)的角色,說(shuō)到:
而長(zhǎng)遠(yuǎn)來(lái)看,未來(lái)人類會(huì)成為強(qiáng)計(jì)算依賴的文明,有80%-90%的能源消耗在計(jì)算之上。
所以改善現(xiàn)有計(jì)算基礎(chǔ)設(shè)施的能效比是很重要的事情。
Transformer的能效比不太好,效率也不高,用戶使用的延遲過(guò)長(zhǎng),需要進(jìn)一步的優(yōu)化。
GPU的能耗比也不太好,而且現(xiàn)在像H100這樣的GPU已經(jīng)不會(huì)輸出圖像了,所以叫GPU已經(jīng)不太合適了。
馬斯克還在推上表示,使用自回歸Transfomer的LLM能效極差,不僅在訓(xùn)練中如此,在推理中也是如此。我認(rèn)為它偏離了幾個(gè)數(shù)量級(jí)。
接下來(lái),馬斯克就開始為他即將進(jìn)行的直播造勢(shì),聊起了自己將演示FSD V 12的上路直播。
他反復(fù)強(qiáng)調(diào)Tesla在新版FSD的加持之下,將會(huì)帶來(lái)非常順滑的乘坐體驗(yàn)。
能夠模擬優(yōu)秀的司機(jī)來(lái)駕駛汽車,不會(huì)像之前的系統(tǒng)一樣偶爾顯得像一個(gè)新手開車一樣。
聊到這里,他拂袖而去,最后只留下一句話,讓大家趕緊去看他馬上開始的自動(dòng)駕駛的直播。
不得不說(shuō),公關(guān)流量這一塊,馬老板玩得是明明白白的!
網(wǎng)友熱議看完這次的直播之后網(wǎng)友紛紛表示,一切看起來(lái)都很nice!
不用聯(lián)網(wǎng)實(shí)在是太棒了。
還有人稱,簡(jiǎn)直就是DriveGPT。
目前看來(lái)沒(méi)有任何自動(dòng)駕駛技術(shù)能接近這個(gè)表現(xiàn)。
但也有網(wǎng)友表示,V12的新任務(wù)是接受亞洲交通的考驗(yàn),并上了一段中國(guó)某路口的視頻......
這位網(wǎng)友貼心地總結(jié)出了他認(rèn)為視頻中的亮點(diǎn):
特斯拉的推理只需要100w的功率支持,不用聯(lián)網(wǎng)
能自動(dòng)處理環(huán)島,自行車,行人。
所有的訓(xùn)練都是基于英偉達(dá)的GPU和Dojo,而且AI駕駛連地圖都不需要,只需要GPS數(shù)據(jù)就行。
關(guān)鍵詞:
當(dāng)?shù)貢r(shí)間8月26日,馬斯克親自上線開啟了一場(chǎng)FSDBetaV12試駕直播,引百
在今年早些時(shí)候的RedHatSummit峰會(huì)上,RedHat通過(guò)OpenShiftAI深化了平
“推動(dòng)業(yè)務(wù)”是數(shù)據(jù)人最怕的詞了。媽耶,還推動(dòng)業(yè)務(wù)呢,我自己不被業(yè)務(wù)
文件夾不能雙擊打開?在本文中,我們將向您展示總共五個(gè)解決方案,以便
今天的IT領(lǐng)導(dǎo)者不僅僅是技術(shù)專家,他們還是負(fù)責(zé)推動(dòng)及時(shí)成果的業(yè)務(wù)領(lǐng)導(dǎo)
本文轉(zhuǎn)載自微信公眾號(hào)「DDD和微服務(wù)」,作者shaogefenhao。轉(zhuǎn)載本文請(qǐng)
2023年網(wǎng)絡(luò)安全威脅和解決方案預(yù)測(cè)針對(duì)智能設(shè)備的威脅增加:專家預(yù)測(cè),
在處理大規(guī)模數(shù)據(jù)時(shí),數(shù)據(jù)庫(kù)性能和存儲(chǔ)效率是至關(guān)重要的。Oracle數(shù)據(jù)庫(kù)
Linux系統(tǒng)的架構(gòu)基礎(chǔ)就是文件,系統(tǒng)中的所有東西都可以歸結(jié)為一個(gè)個(gè)文
當(dāng)我們調(diào)用CreateEvent函數(shù)創(chuàng)建一個(gè)事件對(duì)象的時(shí)候,我們可以通過(guò)參數(shù)
最近有人問(wèn)我下面這個(gè)問(wèn)題,我們依然可以使用之前我提到的“思維調(diào)試”
前言大家好,我是林三心,用最通俗易懂的話講最難的知識(shí)點(diǎn)是我的座右銘
前言4G的機(jī)器上申請(qǐng)8G的內(nèi)存,是否可以成功?這個(gè)問(wèn)題沒(méi)有辦法,是沒(méi)有
VisualStudioCode是一款功能強(qiáng)大、可擴(kuò)展且輕量級(jí)的代碼編輯器,經(jīng)過(guò)多
數(shù)據(jù)寶統(tǒng)計(jì),截至8月25日收盤,滬深兩市共有59只個(gè)股連續(xù)5日或5日以上