文|劉俊宏
編|王一粟
一向強(qiáng)調(diào)產(chǎn)品大于技術(shù)的理想汽車(下面簡稱“理想”),也加入了智能駕駛的“端到端”競賽。
就在7月5日的智駕發(fā)布會上,理想一反常態(tài),先宣布了全國無圖NOA全量推送。隨后,理想宣布,下一版本即將落地的大模型“端到端”智駕。
這意味著,從2023年才開始將智駕領(lǐng)先作為核心戰(zhàn)略目標(biāo)的理想,不僅追平了高階智駕落地,更是在端到端的技術(shù)路線上,比已經(jīng)落地的華為和小鵬還要激進(jìn)。
一年來,理想在智駕技術(shù)的追趕中幾次經(jīng)歷變動(dòng)。
在2023年5月時(shí),理想汽車智能駕駛副總裁郎咸朋在一次采訪中還表示,理想還在做無圖化的BEV+OCC智駕架構(gòu)。而在今年的中國汽車藍(lán)皮書論壇上,郎咸朋就一步跨為了端到端賽道的擁護(hù)者,“端到端+大模型,是更接近于人類駕駛的智能駕駛方案”。
除了郎咸朋,理想智駕“端到端”背后的核心研發(fā)人員,包括智能駕駛技術(shù)研發(fā)負(fù)責(zé)人賈鵬和高級算法專家詹錕。
無論是理想、華為、小鵬還是長城汽車,中國智駕玩家們普遍采用“分段式”的路線,與特斯拉FSD一步到位的“跨越式”端到端方案,形成了鮮明的對壘。
不過,對于理想這家善于用產(chǎn)品定義智能汽車的公司而言,智駕最大的意義在于理想拿下了智能汽車設(shè)計(jì)“工具箱”的最后一環(huán)。在理想MEGA失利后,理想真正意義上的下一代產(chǎn)品快要來了。
01 “全國都能開”,追平一線智駕水平
“我們很羨慕理想,能在批量交付的車主中,選擇種子用戶來實(shí)驗(yàn)智駕。”一位傳統(tǒng)車企的智能化負(fù)責(zé)人對光錐智能表示。
相比去年就開放“全國都能開”的鴻蒙智行,理想的城市NOA落地節(jié)奏還是稍微慢了一步,智駕能力顯然和銷量不成正比。
2024年,整個(gè)行業(yè)的高階智駕落地再向前推進(jìn)了一大步,理想也跟上了節(jié)奏。
在7月5日的智能駕駛夏季發(fā)布會上,理想終于結(jié)束了今年5月開始的城市NOA測試體驗(yàn)。在智駕OTA6.0的升級中,面向AD MAX版本的用戶全量推送了城市無圖NOA功能。
本次升級,理想智駕通過行業(yè)內(nèi)比較成熟的BEV+OCC+Transformer技術(shù),實(shí)現(xiàn)了理想車主期盼已久的城市NOA。針對具體能力,理想還總結(jié)出了“哪里都能開、繞行絲滑、路口輕松、默契安心”的四大特色。
其中,“哪里都能開”是智駕行業(yè)“去高精地圖”的成果。在普通導(dǎo)航地圖的指引下,智駕“有路就能開”?!奥房谳p松”和“默契安心”,主要基于BEV+OCC技術(shù)的應(yīng)用,智駕系統(tǒng)能夠認(rèn)識到外部環(huán)境,并做出相應(yīng)的反應(yīng)。
“在我并線時(shí),我看到了一個(gè)對象,汽車也看到并立即作出響應(yīng),這就是一種默契和安心”,智駕順暢通行的能力,理想汽車產(chǎn)品部高級副總裁范皓稱。
具體的特色功能,主要聚焦在“繞行絲滑”上。
在老城區(qū)場景中,經(jīng)常會遇到前方車輛突然停下接人的情況。對于這種情況,行業(yè)內(nèi)不少智駕玩家的決策是等待前車再次啟動(dòng)(或等一會再繞行)。而理想的“繞行絲滑”,則是與人類司機(jī)一樣,等一秒鐘便立刻“打一把方向盤”繞開。
“不磨嘰”繞行的背后,是理想在BEV中添加了時(shí)序概念。讓傳統(tǒng)BEV視角下,只能感受單幀圖像內(nèi)障礙物的智駕系統(tǒng),擁有了“預(yù)判”未來的能力。
智駕理解時(shí)間的重要性,恰如人類的時(shí)間知覺。就像是人類結(jié)合自身位置和飛行軌跡接飛盤一樣,在多幀畫面的綜合理解下,智駕也能明白事物的延續(xù)性和順序性。對應(yīng)到具體操作上,是預(yù)測自車與他車的空間交互關(guān)系,規(guī)劃未來時(shí)間窗口內(nèi)的所有可行駛軌跡,進(jìn)而無需“觀望”果斷繞行。
通過這四大功能,理想智駕已經(jīng)能夠適應(yīng)絕大部分場景,保障行車安全。但安全只是智駕最基礎(chǔ)的能力,通過部分演示看到,理想智駕在邏輯決策上存在著短板。
例如在轉(zhuǎn)向中,面對斑馬線上加速通過的小孩,理想智駕起初仍選擇正常通過,隨后觸發(fā)AEB緊急剎停。誠然在結(jié)果上,理想智駕沒有發(fā)生事故。但若是真人司機(jī)“操刀”,是看到異常情況立即減速觀望,而非繼續(xù)嘗試通過。
出現(xiàn)如此情況,意味著理想智駕在邏輯決策與智駕控制能力的兩個(gè)層面上,并未完全“對齊”。
邏輯問題,有望在落地端到端大模型后,在下一個(gè)版本中得到優(yōu)化。
02 大模型的“快與慢”
理想的智駕團(tuán)隊(duì)和馬斯克一樣,都喜歡從本體論視角拆解目標(biāo)。
馬斯克從亞里士多德的第一性原理上,認(rèn)識到能源的重要性。而理想智駕團(tuán)隊(duì)從《思考,快與慢》中認(rèn)識到,學(xué)習(xí)人類的思維邏輯,是智駕達(dá)到人類水平的關(guān)鍵。
為了模擬人類的下意識反應(yīng)和深思熟慮操作,理想智駕團(tuán)隊(duì)沒有選擇類似特斯拉FSD的“跨越式”方案,而是搭建了“快慢”雙系統(tǒng)(對應(yīng)系統(tǒng)一和系統(tǒng)二)。
其中,系統(tǒng)一是完全的端到端架構(gòu)。與特斯拉FSD一樣,都是在收到傳感器信息后,直接操作汽車。就像是人類面對正常路況一樣,“加減速”不需要思考太多。這部分的訓(xùn)練,理想選擇了與特斯拉類似的訓(xùn)練方式,讓智駕直接學(xué)習(xí)“五星好司機(jī)”的真實(shí)駕駛視頻。并添加強(qiáng)化學(xué)習(xí),讓智駕在模仿之余,找到更優(yōu)的解法。
在系統(tǒng)一的基礎(chǔ)上,理想將大模型(主要是VLM)作為高級規(guī)控的方式,控制整個(gè)智駕系統(tǒng)的邏輯決策能力。系統(tǒng)二的底層技術(shù)原理,可以理解為參考人類的綜合信息理解能力。理想在傳統(tǒng)智駕的Transformer框架下,將視頻、汽車狀態(tài)等信息統(tǒng)一“扔進(jìn)”一個(gè)編碼器。從而讓智駕獲得“深思熟慮”的能力,避免鬧出“白馬非馬”的笑話。
具體而言,在路口等待的場景中,行業(yè)不少解決方案只能“認(rèn)出”紅綠燈,但具體的讀秒需要導(dǎo)航地圖的反饋,無法實(shí)現(xiàn)智駕自動(dòng)起步。而智駕有了理解能力之后,智駕不僅能“認(rèn)出”紅綠燈,還能明白讀秒的含義。更進(jìn)一步,當(dāng)導(dǎo)航地圖不夠精確的時(shí)候,系統(tǒng)二會根據(jù)實(shí)際需要“糾正”導(dǎo)航地圖的錯(cuò)誤,避免汽車跟著導(dǎo)航開到輔路上。
可以看到,大模型在更好地應(yīng)對路況的同時(shí),也萌生出了“按照自己理解開車的想法”。為了放大模型能力的上限,理想也給出了更符合“大模型體質(zhì)”的訓(xùn)練方法。
在自動(dòng)駕駛領(lǐng)域中,單靠真實(shí)數(shù)據(jù)訓(xùn)練智駕遠(yuǎn)遠(yuǎn)不夠。為了讓智駕學(xué)到現(xiàn)實(shí)難以遇上的Corner Case,需要在仿真環(huán)節(jié)中讓智駕模擬訓(xùn)練。
2021年,特斯拉分享了一套基于3D虛擬+現(xiàn)實(shí)重建的仿真技術(shù)。通過對現(xiàn)實(shí)數(shù)據(jù)采集,特斯拉在虛擬世界模擬重構(gòu)一些如高速上有人奔跑、馬路上擠滿人等“超現(xiàn)實(shí)”場景。雖說這套方案促成了今天的FSD,但缺點(diǎn)也非常明顯。在極大的信息標(biāo)注量和算力需求下,馬斯克買不到足夠訓(xùn)練用的GPU,只能“干看著”。
理想的解決方案,也是行業(yè)內(nèi)目前普遍使用的,是將現(xiàn)實(shí)重建與Diffusion技術(shù)相結(jié)合。以真實(shí)數(shù)據(jù)為基礎(chǔ),“畫出”想象中可能遇到的具體路況。例如在一段汽車駕駛的畫面中,理想的仿真方案能根據(jù)提示詞生成晴天、陰天、雨天、雪天等多種場景用于訓(xùn)練。
“15秒經(jīng)歷一年四季,遍覽世間繁華”,理想汽車智能駕駛技術(shù)負(fù)責(zé)人賈鵬表示。
如今,伴隨著理想城市NOA落地,和即將開啟的端到端大模型智駕測試,或許,理想能夠憑借智駕能力,跳出理想ONE的“圍城”。
03 跳出理想ONE的“圍城”
理想可能是所有造車新勢力們最羨慕的樣子,但也是理想最想擺脫的樣子。
羨慕的部分,是理想以單月超4萬的銷量,以實(shí)力碾碎市場上關(guān)于“增程落后”、“創(chuàng)新全靠冰箱彩電沙發(fā)”的爭議。憑借對汽車產(chǎn)品理解,理想不僅成為了第一個(gè)盈利的造車新勢力,更是以理想ONE開創(chuàng)了中國全新的汽車文化。
汽車工業(yè)過往時(shí)期,巨頭們的崛起主要靠大時(shí)代下的錯(cuò)位競爭。在福特汽車制霸時(shí)期,是標(biāo)準(zhǔn)化生產(chǎn)讓汽車走下“奢侈品神壇”;在日系車拿下美國市場時(shí)期,靠的是石油危機(jī)時(shí)提供的低出行成本;在中國自主品牌興起的現(xiàn)在,一是靠供給側(cè)降本實(shí)現(xiàn)“低價(jià)”對標(biāo)合資車,二是通過電動(dòng)化、智能化彎道超車。
但理想成功的路線,并非承接時(shí)代的機(jī)遇,只靠低價(jià)卷。而是從需求側(cè)出發(fā),以產(chǎn)品經(jīng)理思維重塑了汽車行業(yè)過往從供給側(cè)設(shè)計(jì)產(chǎn)品的模式。
在理想ONE上,理想基于用戶畫像、需求痛點(diǎn)、市場研究、用戶體驗(yàn)等邏輯,給出了上市即交付、盡量少的選配、新能源與續(xù)航兼得(增程)、座艙空間享受等綜合特性的汽車產(chǎn)品。在理想的“一攬子”產(chǎn)品思路下,汽車行業(yè)的后來者們紛紛開始效仿學(xué)習(xí),理想也從理想ONE中差異化“裂變”出整個(gè)“L系列”。
但在此之后,理想真正意義上的下一代產(chǎn)品卻“始終沒有到來”。理想MEGA的受挫,完全可以認(rèn)為是進(jìn)軍純電賽道時(shí)選擇了保守策略,以大型MPV的標(biāo)簽將自己限定在了一個(gè)相對小眾的市場?;蛟S,理想下一次產(chǎn)品的發(fā)力點(diǎn),還得看今年未發(fā)的三款純電產(chǎn)品。
但是,由高階智駕帶動(dòng)的新一輪智能汽車需求,已經(jīng)在揭開汽車市場的“下一幕”了。
隨著2024年越來越多的車企宣布落地高階智駕,在蔚來、理想、小鵬、小米、廣汽、長城等車企,華為、毫末、Momenta、元戎啟行、商湯絕影等頭部智駕供應(yīng)商的共同表態(tài)下,智駕端到端的技術(shù)架構(gòu)也被“提”到了臺前。
甚至,英偉達(dá)汽車事業(yè)部副總裁吳新宙還稱,“端到端,正是智駕三部曲的最終曲”。
智駕玩家們?nèi)绱丝春枚说蕉耍⒉恢皇强吹搅颂厮估璅SD的成功經(jīng)驗(yàn)、技術(shù)架構(gòu)對信息的處理能力,或是大模型訓(xùn)練下的迭代速度。最核心的看好的,是端到端帶來的“主動(dòng)智能”。
正如長城汽車智能平臺開發(fā)中心的高級總監(jiān)姜海鵬所言,“真正智能駕駛終點(diǎn)一定像人一樣有思考,對場景有理解,基于對場景有理解基礎(chǔ)之上做智駕的動(dòng)作”,端到端的路線,讓“機(jī)械”的智駕有了“媲美人類思維”的可能。
不過,目前國內(nèi)已經(jīng)(或準(zhǔn)備)落地玩家的情況,大多都是部分端到端的“分段式”方案,而非特斯拉FSD的“跨越式”架構(gòu)。
其中,華為和小鵬的架構(gòu)比較類似,大致方向是將之前智駕中感知、規(guī)劃、控制“三部曲”,拆分成感知、規(guī)控兩個(gè)“端到端”模型。長城的SEE大模型是將感知部分進(jìn)行“端到端”處理,規(guī)控階段有專家策略參與。理想的方案,則是用VLM充當(dāng)完整端到端架構(gòu)的“高級規(guī)控”,方案最激進(jìn)。
國內(nèi)智駕玩家采用“分段式”端到端架構(gòu)的原因,可以參考李想在今年汽車重慶論壇上對于系統(tǒng)二用途的解釋,“用于端到端的訓(xùn)練,大概一個(gè)月十輪左右的訓(xùn)練,基本就可以完成一個(gè)無圖 NOA 的上限水平。但是面對中國的復(fù)雜路況,只有端到端不夠,我們要思考什么是系統(tǒng)二。系統(tǒng)二的啟發(fā)在于,解決各種各樣的Corner Case和各種泛化的問題”。
換句話說,國內(nèi)智駕系統(tǒng)們對于當(dāng)前大模型能力的不足,在想辦法通過“更強(qiáng)規(guī)控”的工程化方式去落地。
“當(dāng)數(shù)據(jù)達(dá)到特斯拉級別的百萬量級以上,通過對模型的強(qiáng)訓(xùn)練,智駕可學(xué)習(xí)視頻流,就能直接告訴司機(jī)駕駛的方向,像當(dāng)下流行的ChatGPT一樣”,曾在特斯拉主導(dǎo)建立機(jī)器學(xué)習(xí)團(tuán)隊(duì)的谷俊麗在WAIC上如此表示。
但正所謂“羅馬不是一天建成的”,李想在端到端智駕的變革中也找到了自己的方向,“我們認(rèn)為端到端 + VLM + 生成式的驗(yàn)證系統(tǒng),也會是未來整個(gè)物理世界機(jī)器人最重要技術(shù)架構(gòu)和技術(shù)體系”。
本文來自投稿,不代表增長黑客立場,如若轉(zhuǎn)載,請注明出處:http://gptmaths.com/cgo/product/120693.html