文｜劉俊宏

編｜王一粟

一向強(qiáng)調(diào)產(chǎn)品大于技術(shù)的理想汽車（下面簡稱“理想”），也加入了智能駕駛的“端到端”競賽。

就在7月5日的智駕發(fā)布會上，理想一反常態(tài)，先宣布了全國無圖NOA全量推送。隨后，理想宣布，下一版本即將落地的大模型“端到端”智駕。

這意味著，從2023年才開始將智駕領(lǐng)先作為核心戰(zhàn)略目標(biāo)的理想，不僅追平了高階智駕落地，更是在端到端的技術(shù)路線上，比已經(jīng)落地的華為和小鵬還要激進(jìn)。

一年來，理想在智駕技術(shù)的追趕中幾次經(jīng)歷變動(dòng)。

在2023年5月時(shí)，理想汽車智能駕駛副總裁郎咸朋在一次采訪中還表示，理想還在做無圖化的BEV+OCC智駕架構(gòu)。而在今年的中國汽車藍(lán)皮書論壇上，郎咸朋就一步跨為了端到端賽道的擁護(hù)者，“端到端+大模型，是更接近于人類駕駛的智能駕駛方案”。

除了郎咸朋，理想智駕“端到端”背后的核心研發(fā)人員，包括智能駕駛技術(shù)研發(fā)負(fù)責(zé)人賈鵬和高級算法專家詹錕。

無論是理想、華為、小鵬還是長城汽車，中國智駕玩家們普遍采用“分段式”的路線，與特斯拉FSD一步到位的“跨越式”端到端方案，形成了鮮明的對壘。

不過，對于理想這家善于用產(chǎn)品定義智能汽車的公司而言，智駕最大的意義在于理想拿下了智能汽車設(shè)計(jì)“工具箱”的最后一環(huán)。在理想MEGA失利后，理想真正意義上的下一代產(chǎn)品快要來了。

01 “全國都能開”，追平一線智駕水平

“我們很羨慕理想，能在批量交付的車主中，選擇種子用戶來實(shí)驗(yàn)智駕。”一位傳統(tǒng)車企的智能化負(fù)責(zé)人對光錐智能表示。

相比去年就開放“全國都能開”的鴻蒙智行，理想的城市NOA落地節(jié)奏還是稍微慢了一步，智駕能力顯然和銷量不成正比。

2024年，整個(gè)行業(yè)的高階智駕落地再向前推進(jìn)了一大步，理想也跟上了節(jié)奏。

在7月5日的智能駕駛夏季發(fā)布會上，理想終于結(jié)束了今年5月開始的城市NOA測試體驗(yàn)。在智駕OTA6.0的升級中，面向AD MAX版本的用戶全量推送了城市無圖NOA功能。

本次升級，理想智駕通過行業(yè)內(nèi)比較成熟的BEV+OCC+Transformer技術(shù)，實(shí)現(xiàn)了理想車主期盼已久的城市NOA。針對具體能力，理想還總結(jié)出了“哪里都能開、繞行絲滑、路口輕松、默契安心”的四大特色。

其中，“哪里都能開”是智駕行業(yè)“去高精地圖”的成果。在普通導(dǎo)航地圖的指引下，智駕“有路就能開”?！奥房谳p松”和“默契安心”，主要基于BEV+OCC技術(shù)的應(yīng)用，智駕系統(tǒng)能夠認(rèn)識到外部環(huán)境，并做出相應(yīng)的反應(yīng)。

“在我并線時(shí)，我看到了一個(gè)對象，汽車也看到并立即作出響應(yīng)，這就是一種默契和安心”，智駕順暢通行的能力，理想汽車產(chǎn)品部高級副總裁范皓稱。

具體的特色功能，主要聚焦在“繞行絲滑”上。

在老城區(qū)場景中，經(jīng)常會遇到前方車輛突然停下接人的情況。對于這種情況，行業(yè)內(nèi)不少智駕玩家的決策是等待前車再次啟動(dòng)（或等一會再繞行）。而理想的“繞行絲滑”，則是與人類司機(jī)一樣，等一秒鐘便立刻“打一把方向盤”繞開。

“不磨嘰”繞行的背后，是理想在BEV中添加了時(shí)序概念。讓傳統(tǒng)BEV視角下，只能感受單幀圖像內(nèi)障礙物的智駕系統(tǒng)，擁有了“預(yù)判”未來的能力。

智駕理解時(shí)間的重要性，恰如人類的時(shí)間知覺。就像是人類結(jié)合自身位置和飛行軌跡接飛盤一樣，在多幀畫面的綜合理解下，智駕也能明白事物的延續(xù)性和順序性。對應(yīng)到具體操作上，是預(yù)測自車與他車的空間交互關(guān)系，規(guī)劃未來時(shí)間窗口內(nèi)的所有可行駛軌跡，進(jìn)而無需“觀望”果斷繞行。

通過這四大功能，理想智駕已經(jīng)能夠適應(yīng)絕大部分場景，保障行車安全。但安全只是智駕最基礎(chǔ)的能力，通過部分演示看到，理想智駕在邏輯決策上存在著短板。

例如在轉(zhuǎn)向中，面對斑馬線上加速通過的小孩，理想智駕起初仍選擇正常通過，隨后觸發(fā)AEB緊急剎停。誠然在結(jié)果上，理想智駕沒有發(fā)生事故。但若是真人司機(jī)“操刀”，是看到異常情況立即減速觀望，而非繼續(xù)嘗試通過。

出現(xiàn)如此情況，意味著理想智駕在邏輯決策與智駕控制能力的兩個(gè)層面上，并未完全“對齊”。

邏輯問題，有望在落地端到端大模型后，在下一個(gè)版本中得到優(yōu)化。

02 大模型的“快與慢”

理想的智駕團(tuán)隊(duì)和馬斯克一樣，都喜歡從本體論視角拆解目標(biāo)。

馬斯克從亞里士多德的第一性原理上，認(rèn)識到能源的重要性。而理想智駕團(tuán)隊(duì)從《思考，快與慢》中認(rèn)識到，學(xué)習(xí)人類的思維邏輯，是智駕達(dá)到人類水平的關(guān)鍵。

為了模擬人類的下意識反應(yīng)和深思熟慮操作，理想智駕團(tuán)隊(duì)沒有選擇類似特斯拉FSD的“跨越式”方案，而是搭建了“快慢”雙系統(tǒng)（對應(yīng)系統(tǒng)一和系統(tǒng)二）。

其中，系統(tǒng)一是完全的端到端架構(gòu)。與特斯拉FSD一樣，都是在收到傳感器信息后，直接操作汽車。就像是人類面對正常路況一樣，“加減速”不需要思考太多。這部分的訓(xùn)練，理想選擇了與特斯拉類似的訓(xùn)練方式，讓智駕直接學(xué)習(xí)“五星好司機(jī)”的真實(shí)駕駛視頻。并添加強(qiáng)化學(xué)習(xí)，讓智駕在模仿之余，找到更優(yōu)的解法。

在系統(tǒng)一的基礎(chǔ)上，理想將大模型（主要是VLM）作為高級規(guī)控的方式，控制整個(gè)智駕系統(tǒng)的邏輯決策能力。系統(tǒng)二的底層技術(shù)原理，可以理解為參考人類的綜合信息理解能力。理想在傳統(tǒng)智駕的Transformer框架下，將視頻、汽車狀態(tài)等信息統(tǒng)一“扔進(jìn)”一個(gè)編碼器。從而讓智駕獲得“深思熟慮”的能力，避免鬧出“白馬非馬”的笑話。

具體而言，在路口等待的場景中，行業(yè)不少解決方案只能“認(rèn)出”紅綠燈，但具體的讀秒需要導(dǎo)航地圖的反饋，無法實(shí)現(xiàn)智駕自動(dòng)起步。而智駕有了理解能力之后，智駕不僅能“認(rèn)出”紅綠燈，還能明白讀秒的含義。更進(jìn)一步，當(dāng)導(dǎo)航地圖不夠精確的時(shí)候，系統(tǒng)二會根據(jù)實(shí)際需要“糾正”導(dǎo)航地圖的錯(cuò)誤，避免汽車跟著導(dǎo)航開到輔路上。

可以看到，大模型在更好地應(yīng)對路況的同時(shí)，也萌生出了“按照自己理解開車的想法”。為了放大模型能力的上限，理想也給出了更符合“大模型體質(zhì)”的訓(xùn)練方法。

在自動(dòng)駕駛領(lǐng)域中，單靠真實(shí)數(shù)據(jù)訓(xùn)練智駕遠(yuǎn)遠(yuǎn)不夠。為了讓智駕學(xué)到現(xiàn)實(shí)難以遇上的Corner Case，需要在仿真環(huán)節(jié)中讓智駕模擬訓(xùn)練。

2021年，特斯拉分享了一套基于3D虛擬+現(xiàn)實(shí)重建的仿真技術(shù)。通過對現(xiàn)實(shí)數(shù)據(jù)采集，特斯拉在虛擬世界模擬重構(gòu)一些如高速上有人奔跑、馬路上擠滿人等“超現(xiàn)實(shí)”場景。雖說這套方案促成了今天的FSD，但缺點(diǎn)也非常明顯。在極大的信息標(biāo)注量和算力需求下，馬斯克買不到足夠訓(xùn)練用的GPU，只能“干看著”。

理想的解決方案，也是行業(yè)內(nèi)目前普遍使用的，是將現(xiàn)實(shí)重建與Diffusion技術(shù)相結(jié)合。以真實(shí)數(shù)據(jù)為基礎(chǔ)，“畫出”想象中可能遇到的具體路況。例如在一段汽車駕駛的畫面中，理想的仿真方案能根據(jù)提示詞生成晴天、陰天、雨天、雪天等多種場景用于訓(xùn)練。

“15秒經(jīng)歷一年四季，遍覽世間繁華”，理想汽車智能駕駛技術(shù)負(fù)責(zé)人賈鵬表示。

如今，伴隨著理想城市NOA落地，和即將開啟的端到端大模型智駕測試，或許，理想能夠憑借智駕能力，跳出理想ONE的“圍城”。

03 跳出理想ONE的“圍城”

理想可能是所有造車新勢力們最羨慕的樣子，但也是理想最想擺脫的樣子。

羨慕的部分，是理想以單月超4萬的銷量，以實(shí)力碾碎市場上關(guān)于“增程落后”、“創(chuàng)新全靠冰箱彩電沙發(fā)”的爭議。憑借對汽車產(chǎn)品理解，理想不僅成為了第一個(gè)盈利的造車新勢力，更是以理想ONE開創(chuàng)了中國全新的汽車文化。

汽車工業(yè)過往時(shí)期，巨頭們的崛起主要靠大時(shí)代下的錯(cuò)位競爭。在福特汽車制霸時(shí)期，是標(biāo)準(zhǔn)化生產(chǎn)讓汽車走下“奢侈品神壇”；在日系車拿下美國市場時(shí)期，靠的是石油危機(jī)時(shí)提供的低出行成本；在中國自主品牌興起的現(xiàn)在，一是靠供給側(cè)降本實(shí)現(xiàn)“低價(jià)”對標(biāo)合資車，二是通過電動(dòng)化、智能化彎道超車。

但理想成功的路線，并非承接時(shí)代的機(jī)遇，只靠低價(jià)卷。而是從需求側(cè)出發(fā)，以產(chǎn)品經(jīng)理思維重塑了汽車行業(yè)過往從供給側(cè)設(shè)計(jì)產(chǎn)品的模式。

在理想ONE上，理想基于用戶畫像、需求痛點(diǎn)、市場研究、用戶體驗(yàn)等邏輯，給出了上市即交付、盡量少的選配、新能源與續(xù)航兼得（增程）、座艙空間享受等綜合特性的汽車產(chǎn)品。在理想的“一攬子”產(chǎn)品思路下，汽車行業(yè)的后來者們紛紛開始效仿學(xué)習(xí)，理想也從理想ONE中差異化“裂變”出整個(gè)“L系列”。

但在此之后，理想真正意義上的下一代產(chǎn)品卻“始終沒有到來”。理想MEGA的受挫，完全可以認(rèn)為是進(jìn)軍純電賽道時(shí)選擇了保守策略，以大型MPV的標(biāo)簽將自己限定在了一個(gè)相對小眾的市場?；蛟S，理想下一次產(chǎn)品的發(fā)力點(diǎn)，還得看今年未發(fā)的三款純電產(chǎn)品。

但是，由高階智駕帶動(dòng)的新一輪智能汽車需求，已經(jīng)在揭開汽車市場的“下一幕”了。

隨著2024年越來越多的車企宣布落地高階智駕，在蔚來、理想、小鵬、小米、廣汽、長城等車企，華為、毫末、Momenta、元戎啟行、商湯絕影等頭部智駕供應(yīng)商的共同表態(tài)下，智駕端到端的技術(shù)架構(gòu)也被“提”到了臺前。

甚至，英偉達(dá)汽車事業(yè)部副總裁吳新宙還稱，“端到端，正是智駕三部曲的最終曲”。

智駕玩家們?nèi)绱丝春枚说蕉耍⒉恢皇强吹搅颂厮估璅SD的成功經(jīng)驗(yàn)、技術(shù)架構(gòu)對信息的處理能力，或是大模型訓(xùn)練下的迭代速度。最核心的看好的，是端到端帶來的“主動(dòng)智能”。

正如長城汽車智能平臺開發(fā)中心的高級總監(jiān)姜海鵬所言，“真正智能駕駛終點(diǎn)一定像人一樣有思考，對場景有理解，基于對場景有理解基礎(chǔ)之上做智駕的動(dòng)作”，端到端的路線，讓“機(jī)械”的智駕有了“媲美人類思維”的可能。

不過，目前國內(nèi)已經(jīng)（或準(zhǔn)備）落地玩家的情況，大多都是部分端到端的“分段式”方案，而非特斯拉FSD的“跨越式”架構(gòu)。

其中，華為和小鵬的架構(gòu)比較類似，大致方向是將之前智駕中感知、規(guī)劃、控制“三部曲”，拆分成感知、規(guī)控兩個(gè)“端到端”模型。長城的SEE大模型是將感知部分進(jìn)行“端到端”處理，規(guī)控階段有專家策略參與。理想的方案，則是用VLM充當(dāng)完整端到端架構(gòu)的“高級規(guī)控”，方案最激進(jìn)。

國內(nèi)智駕玩家采用“分段式”端到端架構(gòu)的原因，可以參考李想在今年汽車重慶論壇上對于系統(tǒng)二用途的解釋，“用于端到端的訓(xùn)練，大概一個(gè)月十輪左右的訓(xùn)練，基本就可以完成一個(gè)無圖 NOA 的上限水平。但是面對中國的復(fù)雜路況，只有端到端不夠，我們要思考什么是系統(tǒng)二。系統(tǒng)二的啟發(fā)在于，解決各種各樣的Corner Case和各種泛化的問題”。

換句話說，國內(nèi)智駕系統(tǒng)們對于當(dāng)前大模型能力的不足，在想辦法通過“更強(qiáng)規(guī)控”的工程化方式去落地。

“當(dāng)數(shù)據(jù)達(dá)到特斯拉級別的百萬量級以上，通過對模型的強(qiáng)訓(xùn)練，智駕可學(xué)習(xí)視頻流，就能直接告訴司機(jī)駕駛的方向，像當(dāng)下流行的ChatGPT一樣”，曾在特斯拉主導(dǎo)建立機(jī)器學(xué)習(xí)團(tuán)隊(duì)的谷俊麗在WAIC上如此表示。

但正所謂“羅馬不是一天建成的”，李想在端到端智駕的變革中也找到了自己的方向，“我們認(rèn)為端到端 + VLM + 生成式的驗(yàn)證系統(tǒng)，也會是未來整個(gè)物理世界機(jī)器人最重要技術(shù)架構(gòu)和技術(shù)體系”。

加入“端到端”競賽，理想智駕的“快與慢”

01 “全國都能開”，追平一線智駕水平

02 大模型的“快與慢”

03 跳出理想ONE的“圍城”

關(guān)于作者

光錐智能

發(fā)表回復(fù)

加入“端到端”競賽，理想智駕的“快與慢”

01 “全國都能開”，追平一線智駕水平

02 大模型的“快與慢”

03 跳出理想ONE的“圍城”

關(guān)于作者

光錐智能

增長黑客Growthhk.cn薦讀更多>>

Soul如何讓年輕人的“靈魂”心甘情愿的買單？

以前有個(gè)客戶特別好，每次都來買很多，可惜現(xiàn)在孩子大了，不來了

支付寶開放生態(tài)進(jìn)入AI時(shí)代，推出智能體開發(fā)平臺“百寶箱”

對百度公關(guān)副總裁璩靜硬拗“女霸總”網(wǎng)紅人設(shè)翻車的“疑“與”思”，究竟是她錯(cuò)了還是誰錯(cuò)了？

如何判斷產(chǎn)品需求是否靠譜｜小刀子軒

產(chǎn)品市場應(yīng)當(dāng)警惕“路徑依賴”

發(fā)表回復(fù)

加入“端到端”競賽，理想智駕的“快與慢”

01 “全國都能開”，追平一線智駕水平

Soul如何讓年輕人的“靈魂”心甘情愿的買單？

以前有個(gè)客戶特別好，每次都來買很多，可惜現(xiàn)在孩子大了，不來了

對百度公關(guān)副總裁璩靜硬拗“女霸總”網(wǎng)紅人設(shè)翻車的“疑“與”思”，究竟是她錯(cuò)了還是誰錯(cuò)了？