文|劉俊宏
編|王一粟
“如果Waymo接下來進展繼續(xù)緩慢,那將會被全自動駕駛的汽車公司完全趕上?!?/p>
在特斯拉FSD入華在即,全行業(yè)掀起“端到端”浪潮的時刻,小鵬汽車董事長何小鵬在6月底第一時間遠赴美國,實際體驗了一把特斯拉FSD和Waymo無人車的最新進展。
最后的結(jié)論是,L4技術(shù)出發(fā)的Waymo體驗略好于特斯拉。
“Waymo時隔六個月沒有什么進步。AI時代,6個月其實可以做很多事情?!焙涡※i感嘆,這次體驗刷新了“智駕技術(shù)+大模型端到端”所體現(xiàn)的進化速度的認知。
大模型端到端對智駕的進化速度到底有多快?
7月30日,何小鵬以“不限城市、不限路線、不限路況,都能使用XNGP高階智駕”的“全國都好用”目標,掀翻了當前高階智駕“全國都能開”的“天花板”。這距離5月20日小鵬汽車宣布智駕進入大模型端到端時代僅兩個月。
提出“全國都好用”的目標,是何小鵬發(fā)現(xiàn)當前“全國都能開”的智駕仍存在大量需要人類接管的場景。當前的智駕一旦到了掉頭、環(huán)島、收費站、出入停車場等場景下便立馬“歇菜”,整個智駕體驗不流暢。
為了解決特定場景的問題,行業(yè)曾靠人力寫規(guī)則,“告訴”汽車該如何操作。但靠規(guī)則終究無法窮盡,或許智駕廠商能用人力“硬堆”,讓汽車“看懂”中國近萬種的紅綠燈。但在智駕面對鄉(xiāng)間田野小路、小區(qū)內(nèi)部道路,乃至技術(shù)出海到全球的需求,何小鵬在會后采訪中感嘆道,“在以前的規(guī)則下,這個路十年都看不到頭”。
但在智駕大模型端到端的兩天一次的OTA迭代中,何小鵬在行業(yè)對技術(shù)路徑尚未達成共識前,便堅定地認為端到端+大模型能讓智駕走到L4的終點,并充滿了信心稱,“預(yù)計到2024年第四季度,XNGP將打通包括ETC收費站、停車場閘機、園區(qū)內(nèi)部道路在內(nèi)的智駕“斷點”,實現(xiàn)真正的“門到門”體驗”。
何小鵬對智駕大模型端到端的技術(shù)信念,或許如同其在20年前看到移動互聯(lián)網(wǎng)終將普及,遂創(chuàng)辦UC一般。“當無人駕駛的車有足夠大規(guī)模,不需要五星碰撞,車和座椅形態(tài)會產(chǎn)生巨大變化;大屏有變化,你不用坐在司機位或前排點擊,就可以用語音、用投影”,在智能汽車時代,何小鵬也看到了技術(shù)對造車的終局改變。
小鵬汽車的“技術(shù)宅”標簽,是何小鵬一直以來技術(shù)終局思維的結(jié)果。而借助智能化,小鵬汽車能否贏得下一個十年,在銷量上彎道超車?
只有大模型“端到端”,才能智駕“門到門”
“2024年,智能駕駛拐點已經(jīng)到來?!?/p>
在本次的小鵬汽車技術(shù)發(fā)布會上,何小鵬興奮地對當前智駕行業(yè)做了時代的劃分。何小鵬發(fā)現(xiàn),曾經(jīng)需要以“年”為單位計的智駕進展,技術(shù)升級到大模型+端到端后,智駕的能力在以“天”計算。
距離上一次小鵬實現(xiàn)“全國都能開”的兩個月后,智駕即將在第四季度進入“全國都好用”階段。
“全國都好用”與“全國都能開”的差距到底有多大?
具體而言,是何小鵬希望以XNGP(小鵬高階智駕)全新的不限城市、不限路線、不限路況的特性,解決當前高階智駕使用中存在的諸多反邏輯的“BUG”。
按照之前“全國都能開”的目標,當前的高階智駕在高速NOA、城市NOA、自動泊車、一鍵召回等功能下,理論上用戶日常使用應(yīng)該能暢通無阻。但實際上,當用戶要求汽車執(zhí)行完整的駕駛路線時,智駕就“各種辦不到”。例如在內(nèi)部道路會提示無法啟動智駕、環(huán)島提示接管、掉頭和過ETC時“迷?!?、到達目的地后需要用戶手動選擇車位泊車。
究其背后原因,還是“大腦”能力不夠,智駕不夠智能。汽車僅憑傳統(tǒng)的智駕規(guī)則提示,根本無法解決現(xiàn)實世界的理解和推理問題,也就沒辦法解決許多復(fù)雜場景和Corner case。
何小鵬舉例,“有的紅綠燈和ETC上面寫著請直走,等待16秒后左轉(zhuǎn)。這種情況汽車怎么辦,靠激光雷達還是云端互聯(lián)網(wǎng)?”同樣,在大部分智駕玩家棘手的環(huán)島場景中,智駕面臨的難度,主要來自于需要綜合處理更多維度信息。因為在駛出環(huán)島時,相比無保護左轉(zhuǎn),智駕不僅要選擇轉(zhuǎn)向時機,還需要與同向車輛博弈。如此一來,原本流暢的智駕體驗就被一個個“難點”切分成了“一段段”的體驗。
而這些問題,小鵬通過在今年5月20日引入端到端架構(gòu)和AI大語言模型的智駕升級,結(jié)合小鵬走遍全國2595個城市(含縣、地級市)和總里程超過756萬公里的實車測試后,智駕系統(tǒng)都將一一解決,真正意義上做到“舉一反三”。
何小鵬預(yù)期,小鵬將在今年四季度推送能夠暢通ETC、小區(qū)入口檔桿、工廠內(nèi)部道路等場景的智駕版本,將用戶從家門口一路送到辦公室大門口的“門到門”。
同時,為了進一步讓用戶認可智駕的能力,何小鵬還對智駕設(shè)置了200公里接管一次的目標。相當于一周接管一次的頻率,徹底解除用戶使用智駕隨時準備接管的“焦慮”。
此外,在大模型端到端的迭代下,小鵬不僅提高了智駕使用的穩(wěn)定性,還從中訓(xùn)練出了兩個新的功能。其中,基于智駕對道路的理解記憶能力,“100 米循跡倒車”功能可以幫助用戶將不小心開入“斷頭路”的汽車一鍵駛回原位。另一邊,基于大模型的多模態(tài)輸入能力,現(xiàn)在的自動泊車不再必須用手機控制。用戶只需要下車用手遮住特定車外攝像頭,便能自動觸發(fā)自動泊車。
看到短短兩個月小鵬在智駕上的進化,何小鵬驗證了其早前對大模型端到端的猜想,“端到端自動駕駛技術(shù)范式,從0到1很難、很慢,但從1到100會非??臁?,也更進一步堅定了何小鵬加大投入智駕開發(fā)的決心。
當前,小鵬汽車已經(jīng)擁有了AI算力儲備2.51 EFLOPS,并且,面向未來的AI研發(fā)投入,何小鵬也擔保稱,“比今年的35億,只多不少”。
轉(zhuǎn)型“端到端”,不破不立
去年,特斯拉FSD開辟出智駕端到端方案。即便國內(nèi)不少玩家也開始跟進,但特斯拉FSD到底是怎么實現(xiàn)大模型+“一體化”端到端的問題,一直困擾著整個智駕行業(yè)。
“特斯拉FSD v12云端,那個十億參數(shù)的模型是干什么的?”在上海2024端到端具身智能體技術(shù)研討會上,有人問了這樣一個問題。
但遺憾的是無人給出答案,即便參會人員中包括小米自動駕駛部總經(jīng)理葉航軍、華為智能汽車解決方案BU CTO卞紅林、滴滴自動駕駛AI Research團隊負責(zé)人史少帥、蔚來首席AI科學(xué)家袁宏輝等一眾大佬。
甚至,光輪智能CEO、前蔚來仿真負責(zé)人謝晨還提醒道,“摸著特斯拉前進,結(jié)果不一定是過河,也可能是掉坑”。
而這個問題的答案,在本次小鵬的技術(shù)發(fā)布會上被“揭開了一角”——端到端的智駕路線或許對此前的智駕開發(fā)是一場徹底的顛覆。
在發(fā)布會和會后的采訪中,何小鵬和小鵬汽車智能駕駛負責(zé)人李力耘回顧推進智駕大模型端到端的進程,“大倒苦水”。
大模型端到端對智駕能力的提升速度,何小鵬在欣喜之余,也請求消費者能夠理解大模型優(yōu)化迭代過程中的不穩(wěn)定,“升級版本時,可能智駕能力會發(fā)生抖動。但整個智駕能力,一定是快速向前的”。
而作為小鵬智駕能力的負責(zé)人,李力耘親身感受到了端到端來臨后,對工作的具體影響。
“端到端這座冰山,水面下看不見的部分很多。(雖然)以前好多高效高質(zhì)量的數(shù)據(jù)用不上,但(落地端到端過程中)這些全棧自研原始的數(shù)據(jù),以及由此構(gòu)建的閉環(huán)能力、體系能力,是真正決定一家車企能否在AI的淘汰賽中經(jīng)過洗牌,并成功活下來”。
雖然本次小鵬沒有透露太多端到端智駕的開發(fā)過程,但總結(jié)何小鵬和李力耘的發(fā)言看到,兩人都認為大模型端到端智駕是一場“技術(shù)洗牌”;另外,從“傳統(tǒng)”智駕開發(fā)模式轉(zhuǎn)到端到端,智駕開發(fā)會遇到一系列問題,包括損失大量已有數(shù)據(jù)、大幅度調(diào)整開發(fā)和組織架構(gòu)、以及一套全新工程能力配套等一系列問題。
最后,智駕廠商能夠保證每次迭代時智駕水平整體升級,但不能保證在每個細分場景中都發(fā)揮穩(wěn)定。
不過,面對如此多的困難和限制,何小鵬認為這都是大模型端到端“不破不立”的成長。
“不是說以前的工作全部白做了,可能有25%到30%的工作白做,但75%-80%的工作都有用。樓要一層一層搭,想跳躍式發(fā)展或許有可能,但風(fēng)險會極高”。何小鵬稱。
如此看來,從傳統(tǒng)智駕開發(fā)直接“跨越”到一體式端到端,幾乎是“癡人說夢”。“分段式”跟進端到端,幾乎成了中國智駕的最佳選擇。
一方面,何小鵬認為,“以前沒做過端到端的人,只靠一個模型根本搞不定。從算力到OS、模型、數(shù)據(jù)、地圖、仿真、標定再到工程,這一系列的事情不經(jīng)歷過根本搞不定”;另一方面,“分段式”的端到端方案,實際上也為智駕玩家們“鞏固”原有能力的基礎(chǔ)上,提供了過渡到“一體化”端到端的手段。
智駕玩家們根據(jù)現(xiàn)階段對端到端的理解,搭建了不同的技術(shù)架構(gòu)。其中,有利用大模型的能力,增加智駕對現(xiàn)實世界理解能力的(例如小鵬、理想);也有利用端到端的高效數(shù)據(jù)處理能力,提升原本模塊化架構(gòu)的智駕系統(tǒng)(例如長城汽車)。
如果將汽車看作是手機,那么現(xiàn)在的智駕如同20年前的移動互聯(lián)網(wǎng)。智駕對智能汽車的重要性,恰如何小鵬創(chuàng)辦UC時,看到的瀏覽器作為“超級APP”對整個手機內(nèi)容的改變。
因此作為技術(shù)派,何小鵬預(yù)判并擁抱了下個時代的趨勢——在智駕成長最快的時代,做好智駕比短時間內(nèi)銷量多少更重要。
何小鵬如此重視智駕,同樣也是對“智能化如何重塑汽車”的終局思考,小鵬汽車或許也有了最終的方向。
面對銷量焦慮,何小鵬:磨刀不誤砍柴工
除何小鵬以外,每一位企業(yè)家選擇的背后,都體現(xiàn)著出發(fā)點不同的終局思考。
面對智能汽車行業(yè)的終局,雷軍判斷,“最后是贏家通吃”。
如果說雷軍對智能汽車的思考更偏向于“過往消費電子行業(yè)的經(jīng)驗”,那對于智能汽車的終極狀態(tài),不少汽車廠商也都給出過自己的答案。
在比亞迪看來,汽車智能就是整車智能,要用智能控制介入到汽車的每一個角落;華為在利用自己多年積累下的智能化和工程能力,改造原本不智能的汽車產(chǎn)品;蔚來則認為,造智能汽車應(yīng)該從底層做起,從補能方式、底層OS、芯片等層面都要重新造一遍。
反觀小鵬汽車,或許也能看到何小鵬對智能汽車的終局思考有一定的感知——如何用智能化技術(shù)作為底層,重新定義汽車。
最明顯的體現(xiàn),是在智駕的底層原理上,小鵬智駕的基本邏輯就與其他玩家不太一樣。
一般而言,當前高階智駕的基本原理是BEV+占用網(wǎng)絡(luò),大多數(shù)智駕廠商更重視汽車的可通過性,對道路物體識別采取的是“點到為止”(主要是識別異形障礙物、行人、錐形桶、路牌、道路信息等)的態(tài)度。但小鵬的智駕十分重視對現(xiàn)實世界的理解能力,不斷訓(xùn)練智駕能夠認識更多的目標物、理解道路信息,比如交警行為指令、指示牌標語、地面指示符號等等。
同樣,在智艙的理解上,2024年小鵬的智艙轉(zhuǎn)向到了實用的智能化方向。
不過這次小鵬的智艙OTA亮點不多。結(jié)合上次5月20號的更新,小鵬主要拓寬了車機的交互模式。例如利用“NFC貼紙”、蘋果Siri和上次的“小P助手”控制汽車。
但深入到具體的優(yōu)化方向,能看到小鵬在從優(yōu)化車機系統(tǒng)開始,到這次可以定制車機顯示、駕駛模式,逐漸深化座艙對整車的控制能力。
甚至,在加速消費者接受智駕的層面,何小鵬還提出了比“直播挑戰(zhàn)”更好的方法——在汽車啟動智駕后,能讓更多的人看到當前高階智駕的能力。
如今的小鵬汽車,變得沉穩(wěn)了許多。
沉穩(wěn)的資本,或許還是因堅持智能化而“路越走越寬”。何小鵬在對技術(shù)的堅持下,也變得越來越樂觀,“從前年開始,我們的變化越來越明顯,我對長期馬拉松長跑的勝利越來越充滿信心”。
比起一年前的動蕩時刻,如今的小鵬在智能化的積累下,收到了來自大眾的合作收入、即將推出更便宜的高價智駕車型(MONA M03),還展望了2026年推出Robotaxi。
而面對是否會有銷量焦慮的問題,何小鵬認為當下最重要的還是打磨好AI,“磨刀不誤砍柴工。過去十幾個月來,小鵬都在磨刀階段”。或許,在自動駕駛尚未徹底改變智能汽車形態(tài)之前,在如今車市的價格和銷量內(nèi)卷的牌桌之下,還藏著一個要掀桌子的玩家。
本文來自投稿,不代表增長黑客立場,如若轉(zhuǎn)載,請注明出處:http://gptmaths.com/cgo/121892.html