文/周雄飛
幾座城鎮(zhèn),一些河流,外加7個(gè)島嶼,組成一個(gè)七角星圖案。
這些描述,是世界已知最古老的地圖之一——古巴比倫地圖的內(nèi)容。早在公元前6世紀(jì),人們已經(jīng)開始制作簡易地圖,來記錄和展示住處周邊的地理和位置信息。
歷史車輪滾滾向前,地圖逐漸成為人類文明發(fā)展中最重要的工具之一,其功能和形態(tài)也多次轉(zhuǎn)變。作為國內(nèi)用戶常用的地圖軟件——百度地圖,在過去18年中,也經(jīng)歷了非常大的迭代和升級(jí)。
隨著AI時(shí)代的到來,以百度為頭雁的大廠,正在推動(dòng)地圖行業(yè)進(jìn)行又一次的進(jìn)化。
2023年百度世界大會(huì)上,百度發(fā)布了一系列AI原生應(yīng)用,包括新搜索、文庫、網(wǎng)盤、GBI、新地圖等多款產(chǎn)品。按照百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏的介紹,這些AI原生應(yīng)用,都基于文心大模型進(jìn)行了全面的重構(gòu),真正用AI原生思維“重想、重做”,希望能拓展大家的想象力。
其中,重構(gòu)后的百度地圖成為全球首個(gè)AI原生地圖應(yīng)用,全新推出“AI向?qū)А?,能與用戶進(jìn)行“真人交流”,并在理解需求的基礎(chǔ)上,智能調(diào)用眾多地圖功能及服務(wù),快捷準(zhǔn)確地給出解決方案,比如幫助用戶規(guī)劃路線、提供地點(diǎn)決策建議,以及服務(wù)預(yù)定等等。
這些也正符合李彥宏對(duì)于AI原生應(yīng)用的定義——能用自然語言交互、能充分理解、生成、邏輯、記憶,并且每個(gè)應(yīng)用的交互都不超過兩級(jí)菜單,一步到位。
除了交互升級(jí)之外,在導(dǎo)航基本功方面,百度地圖近期全新升級(jí)的城市車道級(jí)導(dǎo)航3.0,可以提供更加清晰和立體的導(dǎo)航指引,提升駕駛安全和體驗(yàn)。
同時(shí),百度地圖還落地了行業(yè)首個(gè)地圖生成大模型,顯著加速車道級(jí)地圖規(guī)模量產(chǎn),既讓更多用戶可以體驗(yàn)升級(jí)版的導(dǎo)航服務(wù),也能幫助車企降低自動(dòng)駕駛研發(fā)過程中的成本,實(shí)現(xiàn)“低成本用好圖”。
在大模型行業(yè)如此內(nèi)卷、誰都不知道“標(biāo)準(zhǔn)答案”的當(dāng)下,百度地圖是如何實(shí)現(xiàn)這些創(chuàng)新的?這個(gè)問題與“大模型行業(yè)會(huì)走向何處”,同樣值得思考。
1、離不開的地圖,能變得更“聰明”嗎?
方涵是一位自駕游愛好者,地圖導(dǎo)航是他最常用的手機(jī)應(yīng)用之一。作為深度用戶,他對(duì)地圖無疑有著更高的期待,比如當(dāng)他要開車去某個(gè)新發(fā)現(xiàn)的露營地,再順路接個(gè)朋友,并且不想走高速時(shí),只要對(duì)著地圖說出需求,就可以幫他規(guī)劃好最佳的出行方案。
有類似需求的用戶,還有很多。地圖里那么多的產(chǎn)品能力,有時(shí)甚至需要用戶點(diǎn)個(gè)六、七次,才能準(zhǔn)確滿足像方涵這種相對(duì)精細(xì)化的出行需求。
這些功能,之所以容易被用戶忽略,主要是因?yàn)樗鼈円话悴粫?huì)出現(xiàn)在地圖的首頁,而是被隱藏到二級(jí),乃至更深的菜單層級(jí)中。換句話說,地圖軟件擁有豐富的功能,但用戶并不知道這些功能被“藏”在哪里,真到用時(shí)“找不著”。
“在過去十八年中,百度地圖開發(fā)了幾千個(gè)功能,包括導(dǎo)航、公交、打車、訂酒店和足跡等等。如何讓我們的用戶需求和這些豐富的功能聯(lián)動(dòng)起來,打造更加便捷的交互體驗(yàn),是我們一直在思考的問題?!?/strong>百度副總裁尚國斌對(duì)連線Insight表示。
百度地圖中的眾多功能
雖然如此,但對(duì)于廣大用戶來說,地圖服務(wù)毫無疑問是生活出行的剛需。那么,如何解決以上這些問題,在業(yè)內(nèi)看來或許會(huì)成為地圖行業(yè)下半場的新機(jī)遇。對(duì)此,以百度為代表的大廠已經(jīng)行動(dòng)起來。
2、融合大模型,讓地圖真正變成“AI向?qū)А?/strong>
大模型,已成為千行百業(yè)追逐的技術(shù)熱潮。
隨著OpenAI發(fā)布ChatGPT、引發(fā)一聲驚雷后,國內(nèi)科技及互聯(lián)網(wǎng)行業(yè)隨即展開了一場有關(guān)大模型的競逐賽。就目前來看,百度、騰訊、阿里巴巴和華為都已入局,國內(nèi)已經(jīng)發(fā)布的大模型也已超過120個(gè),10億參數(shù)規(guī)模以上的大模型就已經(jīng)有79個(gè),真可謂是“百模大戰(zhàn)”。
但百模大戰(zhàn)中,究竟什么才是獲勝關(guān)鍵?誰更有機(jī)會(huì)?李彥宏曾表示,模型本身是不直接產(chǎn)生價(jià)值的,基于基礎(chǔ)大模型開發(fā)出來的應(yīng)用才是模型存在的意義。
作為國內(nèi)較早布局大模型之一的大廠,百度也憑借在地圖領(lǐng)域的多年積累,率先打響了應(yīng)用的“第一槍”。
據(jù)李彥宏介紹,重構(gòu)的百度地圖之所以被稱為AI原生地圖,最明顯的特點(diǎn),就是具備多輪自然語言交互能力,能提供更接近“真人交流”的體驗(yàn)。
舉個(gè)例子,當(dāng)連線Insight對(duì)百度地圖AI向?qū)дf出“我要去杭州大廈,還要去杭州運(yùn)河大劇院接個(gè)人,順便在路上給車充個(gè)電”的要求后,百度地圖不僅能快速理解這些口語化的表達(dá),給到精確的路線方案,甚至主動(dòng)推薦附近適合停車的地方。如果描述不清楚也沒關(guān)系,AI向?qū)б矔?huì)主動(dòng)追問,確保理解和滿足用戶的真實(shí)需求。
另一方面,以往地圖上很多需求,用戶要么很難找到入口,或是操作起來步驟太多,AI重構(gòu)的百度地圖,也已嘗試解決。
正如百度世界2023現(xiàn)場李彥宏演示的那樣,當(dāng)問到百度地圖“幫我推薦離百度大廈、中國美術(shù)館和望京SOHO距離都差不多的餐廳,要適合安靜聚會(huì)”時(shí),AI向?qū)Ь蜁?huì)根據(jù)需求,智能推薦符合需求的一些餐館。
緊接著,李彥宏又給出新的需求“幫我換個(gè)西餐廳,并且對(duì)比下前兩家的環(huán)境”,AI向?qū)в挚旖莸亟o出結(jié)果,并且用更直觀的圖片來對(duì)比餐館的環(huán)境。當(dāng)他選擇其中一家餐廳,并要求給出能在指定時(shí)間到達(dá)目的地的行程規(guī)劃,以及打車需求后,AI向?qū)б簿_地滿足了這些需求。
此外,據(jù)百度官方介紹,基于大模型深度學(xué)習(xí)的能力,這個(gè)“AI向?qū)А辈粌H具備人格化的數(shù)字人形象,還擁有自主學(xué)習(xí)的能力,會(huì)越用越聰明, 越用越懂你。連線Insight也搶先體驗(yàn)了下,只要上傳五張圖片,就可生成自己的專屬數(shù)字人形象。
在業(yè)內(nèi)看來,基于這些交互形態(tài)的進(jìn)化,不僅可以讓百度地圖成為理解用戶所思所想的“AI向?qū)А?,提升出行和決策效率,同時(shí)隨著AI向?qū)У膹V泛使用,源源不斷的真實(shí)反饋也會(huì)幫助百度地圖構(gòu)建起更好的問答數(shù)據(jù)飛輪,以便在不斷的學(xué)習(xí)中,越來越聰明好用。
更為重要的是,作為國民地圖,百度地圖率先行業(yè)實(shí)現(xiàn)了以上這些能力,也讓大眾對(duì)AI大模型助力下的原生應(yīng)用有了更深的了解和信任,進(jìn)而推動(dòng)整個(gè)地圖行業(yè)的更快發(fā)展。
毫無疑問,這與百度對(duì)行業(yè)的深度觀察,以及持續(xù)不斷的底層技術(shù)積累密不可分。
3、“AI向?qū)А笔侨绾巍盁挕背傻模?/strong>
大模型落地,不是一蹴而就的。
眾所周知,通用大模型雖然具備推理和涌現(xiàn)的能力,但如果知識(shí)庫中沒有太多的行業(yè)數(shù)據(jù),硬是通過簡單訓(xùn)練來當(dāng)行業(yè)大模型使用,很有可能鬧出笑話。比如企業(yè)如果僅是通過接入通用大模型API來做自身的大模型,最后的驗(yàn)證結(jié)果,往往會(huì)與行業(yè)真實(shí)情況差距甚大。
更為保險(xiǎn)的做法,就是基于通用大模型和特定行業(yè)的知識(shí)庫數(shù)據(jù),來構(gòu)建預(yù)訓(xùn)練大模型,以便更好地對(duì)行業(yè)問題進(jìn)行推理和預(yù)測。但在這個(gè)過程中,行業(yè)大模型也有可能給出不夠精確的結(jié)果,從而無法實(shí)現(xiàn)真正的降本增效。
與所有行業(yè)大模型一樣,這些問題,同樣不可避免會(huì)出現(xiàn)在地圖AI原生應(yīng)用中。
首先,嘈雜環(huán)境下語音識(shí)別和語義理解的難度,尤其是難以過濾無效語義,已成為行業(yè)公認(rèn)難題。打個(gè)比方,如果用戶說話斷斷續(xù)續(xù)的,或者一個(gè)字說了很多遍,又或者問詢的用戶不止一人、中途有人打斷等等,這些都對(duì)“AI向?qū)А钡睦斫饽芰μ岢隽烁叩囊蟆?/p>
對(duì)于地圖軟件來說,首先需要解決用戶自然語言開放式輸入的理解難題。 為此,百度地圖在重構(gòu)過程中,基于文心大模型的強(qiáng)化學(xué)習(xí)與訓(xùn)練方式,使得其“AI向?qū)А钡睦斫夂屯评砟芰?shí)現(xiàn)了顯著提升。據(jù)百度介紹,AI向?qū)Э梢栽诶斫鈴?fù)雜語句語義,甚至局部出現(xiàn)輸入錯(cuò)誤或者錯(cuò)亂時(shí),依然能給出較為理想的答案。
其次,在地圖出行決策中,給出答案并不夠,還需要避免出現(xiàn)不準(zhǔn)確的答案。
由于地圖行業(yè)的特殊性,無論是過去還是現(xiàn)在,都需要精準(zhǔn)滿足用戶需求,像路線、POI 點(diǎn)這些信息,“失之毫厘”可能就會(huì)“差之千里”。這也意味著大模型給出的任何結(jié)果,都需要建立在準(zhǔn)確的前提上。反之,如果給出不準(zhǔn)確,或者模棱兩可的答案,就會(huì)直接影響到用戶的使用體驗(yàn)。
對(duì)此,百度通過把地圖領(lǐng)域知識(shí)進(jìn)行整理和清洗,再轉(zhuǎn)化為供大模型訓(xùn)練的行業(yè)知識(shí)庫數(shù)據(jù),可以讓其學(xué)會(huì)地圖領(lǐng)域的專有知識(shí)。同時(shí),百度地圖還通過構(gòu)建大模型插件,來保證像實(shí)時(shí)交通計(jì)算等專業(yè)問題的準(zhǔn)確解答。
按照百度官方的介紹,這些大模型插件就像一個(gè)個(gè)專業(yè)領(lǐng)域的知識(shí)“倉庫”,大模型在處理專業(yè)領(lǐng)域的問題時(shí),就可以基于對(duì)用戶問題的理解,靈活判斷需要借助哪些插件的能力,從而針對(duì)性解決用戶的問題。
這個(gè)過程,就像人們要用手機(jī)解決點(diǎn)餐、計(jì)算等問題時(shí),打開App Store選擇一個(gè)個(gè)特定應(yīng)用軟件一樣。在這些插件和文心大模型的支持下,百度地圖就好比長出了眼睛、嘴巴和手臂,能看、能說、能聽和能行動(dòng),成為百度口中的“AI原生地圖智能體”。
就目前來看,這場有關(guān)大模型的技術(shù)革命還在繼續(xù),行業(yè)中的眾多玩家們都還在探索落地應(yīng)用的更多可能性。這其中,也可以看到百度正通過自身的行動(dòng),持續(xù)給整個(gè)大模型乃至人工智能等多行業(yè),帶來一些新的思考和啟發(fā)。
正如李彥宏說的那樣“我們即將進(jìn)入一個(gè)AI原生的時(shí)代,進(jìn)入一個(gè)人機(jī)通過Prompt來交互的時(shí)代,未來將由你生成!未來由我們一起生成!”
(應(yīng)受訪者要求,文中方涵為化名。)
本文來自投稿,不代表增長黑客立場,如若轉(zhuǎn)載,請(qǐng)注明出處:http://gptmaths.com/quan/107366.html