十年1000億,百度在深度學習、NLP、語音、大數(shù)據(jù)等技術(shù)研發(fā)上已經(jīng)應(yīng)用到搜索、金融、電動汽車等業(yè)務(wù),但關(guān)于AI的商業(yè)價值還沒有哪個產(chǎn)品能直觀顯示。
作者/何必
出品/新摘商業(yè)評論
在“ChatGPT熱”已經(jīng)全球風靡兩個月之后,百度決定入局。
近日有多家媒體都報道,百度將在3月份推出類似OpenAI旗下ChatGPT的人工智能聊天機器人服務(wù)。
但事實上,早在去年12月,李彥宏在一場面向全體員工的內(nèi)部直播中就提到過ChatGPT這項技術(shù)及其前景。
“我很高興我們每天都在琢磨的技術(shù)能夠吸引這么多人的關(guān)注,這并不容易,”同時他也表示,“技術(shù)能做到這一步了,但是它會變成什么樣的產(chǎn)品,產(chǎn)品能滿足什么樣的需求,這個鏈條上還有很多不確定性。這個事情很難,但百度必須要做?!?/p>
也無怪乎百度會如此激動,ChatGPT已經(jīng)成為歷史上增長最快的消費應(yīng)用,在推出兩個月之后,月活用戶達1億。就算是TikTok達到這一數(shù)據(jù)也用了大約9個月。
百度作為國內(nèi)AI領(lǐng)域的代表企業(yè),一度以“十年累計投入超過1000億,其中核心研發(fā)的投入占比遠超其他互聯(lián)網(wǎng)大廠”宣稱,自然不會錯過這次由ChatGPT引爆的AIGC概念相關(guān)布局。
但ChatGPT式的產(chǎn)品,能給百度帶來怎樣新的故事?是否能成為百度對外標榜技術(shù)基因、并引以為傲的證詞?百度曾經(jīng)定下的“all in ai”路線又是否到了收獲的季節(jié)?
一、ChatGPT,引領(lǐng)搜索體驗的代際變革
ChatGPT本質(zhì)上還是自然語言生成式AI,能提供高度智能的對話式問答結(jié)果,這顯然很適用于搜索場景。
比如你問它如何看待百度進軍ChatGPT,它也能有模有樣的回答。
作為一款聊天機器人,ChatGPT使用了Transformer神經(jīng)網(wǎng)絡(luò)架構(gòu),訓練數(shù)據(jù)來自包括維基百科,以及真實對話在內(nèi)的龐大語料庫。
這使得它可以輕松與人類進行各個領(lǐng)域的對話,回答各種問題,無論是寫代碼改bug、回答科學問題,還是寫論文、寫文章都不在話下,甚至可以做到與真正人類幾乎無異的聊天場景進行交流(如果不去計較它很多時候會一本正經(jīng)地胡說八道的話)。
圖源:知乎張俊林
而百度作為國內(nèi)最大的搜索引擎,還在人工智能領(lǐng)域摸爬滾打整10年,在ChatGPT剛火的時候,業(yè)內(nèi)人士就猜測百度會跟進。
正如李彥宏所說:“這很宏偉,很激動人心。 但我們認為它是可實現(xiàn)的,因為技術(shù)已經(jīng)到了臨界點。類似ChatGPT這樣的技術(shù)很火,如何用在搜索場景上,這是比技術(shù)本身更難探索的。怎么能把這件事情做出來,讓每天有幾億人從中受益,讓他們的效率有明顯的提升?未來一年,在這方面我們非常有機會?!?/p>
有接近百度的人士跟媒體反應(yīng),去年12月后,百度就“快馬加鞭”投入相關(guān)研發(fā),由搜索(MEG)和技術(shù)中臺(TPG)團隊牽頭,呈現(xiàn)形式將會是生成式搜索,也就是將搜索和ChatGPT結(jié)合。
據(jù)悉,這一應(yīng)用還并未命名,一開始還是會嵌入在搜索服務(wù)中,但有別于傳統(tǒng)的網(wǎng)頁鏈接顯示搜索結(jié)果,它將會提供的更對話化、情境化的回復。
事實上,今年1月初的百度Create AI開發(fā)者大會上,百度搜索就宣布將基于百度自研的生成式模型,升級“生成式搜索”能力。還表示,搜索與生成式AI之間的關(guān)系更像是互補而非替代,百度從2021年就開始嘗試把AIGC與搜索兩者結(jié)合起來。
如今在百度將推出“國產(chǎn)ChatGPT”消息出來后,2月1日,百度美股早盤漲逾15%,同時帶動相關(guān)概念股上揚。
盡管百度官方?jīng)]透露太多消息,但市場還是用腳投票,在不同資本市場信息平臺上,已有投資者紛紛提問百度相關(guān)公司,是否有參與百度ChatGPT相關(guān)項目的合作,足見對其的期待。
理由也很簡單:放眼國內(nèi),不管是說對AI的技術(shù)積累,還是說在自然語言領(lǐng)域的經(jīng)驗優(yōu)勢,百度都首屈一指。
百度在人工智能技術(shù)領(lǐng)域深耕多年,有芯片、框架、模型、應(yīng)用四層技術(shù)棧 。其中,文心系列大模型參數(shù)規(guī)模達到2600億,表現(xiàn)超越谷歌的T5和OpenAI的GPT-3,是全球最大的中文單體模型,在行業(yè)產(chǎn)業(yè)已經(jīng)獲得普遍應(yīng)用。
并且ChatGPT最顯性的價值與落地場景,目前來看還是搜索。對百度來說,“中國ChatGPT”一旦做成,借用生成式搜索的能力,由此或?qū)⒁l(fā)一連串的蝴蝶效應(yīng)。
這也是為何李彥宏把該項目稱為是“引領(lǐng)搜索體驗的代際變革”。
二、從搜索到生成,是“?!币彩恰皺C”
對于自身搜索領(lǐng)域的技術(shù)趨勢,百度其實是有一定預(yù)期的。
在1月初的媒體溝通會上,百度搜索架構(gòu)師辜斯繆就提出三點:第一是搜索從信息檢索到檢索+生成的混合系統(tǒng)。第二是搜索變成跨模態(tài)的理解和交互,搜索將以圖片、視頻、音頻等各種媒介形式理解用戶輸入的信息。第三是在知識的理解和組織基礎(chǔ)上完成搜索。
辜斯繆舉例道,生成一個像“高智商”或知識儲備豐富的人的人工智能,將百度搜索中的信息理解處理后提供給用戶,“我們認為它最終提供的服務(wù)質(zhì)量會遠高于現(xiàn)在待機下的搜索服務(wù)質(zhì)量”。
這正是ChatGPT在做的事。
事實上,我們現(xiàn)在使用的搜索產(chǎn)品只是當時互聯(lián)網(wǎng)技術(shù)的一種妥協(xié)。
在搜索框里輸入關(guān)鍵詞,當找不到合適的答案時,再換幾個關(guān)鍵詞,這一行為習慣的背后是,機器并不能很好地理解自然語言,只能退而求其次,通過信息的重合度來展現(xiàn)不同的網(wǎng)頁和答案。
而現(xiàn)如今ChatGPT已經(jīng)讓人們見到機器理解自然語言的能力有多強大,讓人工智能直接查詢問題并理解和組織答案的可能性已經(jīng)有了。
自然搜索引擎的服務(wù)能力提升也到了一個臨界點,搜索引擎的未來,不僅僅是索引網(wǎng)頁與鏈接,而是為每一個查詢生成相應(yīng)的摘要、回答。這就是從搜索到生成。
而ChatGPT的價值,從微軟和谷歌的反應(yīng)中也能略窺一二。
微軟一邊說要把ChatGPT整合到必應(yīng)里,一邊又表示在Office三件套里也將添加ChatGPT功能,以實現(xiàn)每個人的“PPT自由”,甚至于還放出消息說要追加OpenAI100億美元的投資,大有把其當作三十年來最有回報項目之勢。
谷歌則是緊急發(fā)布“紅色警報”,多次舉行圍繞谷歌人工智能戰(zhàn)略的會議,讓高管反思為什么自家AI產(chǎn)品進展緩慢,并指示公司的許多團隊重新集中精力解決 ChatGPT對其搜索引擎業(yè)務(wù)構(gòu)成的威脅。
連已經(jīng)處于半退休狀態(tài)的兩個創(chuàng)始人都被召回,牽頭舉行關(guān)于AI和搜索兩個領(lǐng)域如何整合的的閉門研討會。
所以,作為同樣處境的全球最大的中文搜索引擎百度,布局ChatGPT也是一種必然。百度必須參與這場前沿競賽,否則時代就會跨過它,繼續(xù)前進。
三、百度需要ChatGPT
盡管業(yè)界現(xiàn)在對于ChatGPT能否取代搜索引擎還是眾說紛紜,在成本側(cè)和內(nèi)容質(zhì)量側(cè),ChatGPT還有難以跨過的技術(shù)鴻溝。但不少業(yè)界人士都認為,生成式AI未來大有可為。
而首先就會影響搜索引擎。摩根士丹利在2022年12月發(fā)布的報告中提到,ChatGPT可能會破壞谷歌作為互聯(lián)網(wǎng)用戶入口的地位。
一旦未來ChatGPT的內(nèi)容質(zhì)量和訓練成本得到進一步改善,像谷歌、百度、搜狗、360這種有搜索業(yè)務(wù)的企業(yè)將成為第一個被沖擊的對象。
百度不可能坐視危機發(fā)生而無動于衷,最好的防守就是進攻,搶先布局才能讓局面可控。
作為一直都想抓住前沿風口的百度來說,已經(jīng)在芯片、自動駕駛、大模型、AIGC、深度學習等領(lǐng)域投入太多,財務(wù)上卻還是靠著搜索業(yè)務(wù)支撐,新業(yè)務(wù)大多還沒看到商業(yè)化落地的例子。
如果百度能在搜索到生成上取得足夠大的先發(fā)優(yōu)勢,這無異于又是一張互聯(lián)網(wǎng)新時代的船票。
另外,對于百度而言,ChatGPT的另一個價值在于推動AIGC發(fā)展。相比PGC、UGC,AIGC(AI生產(chǎn)內(nèi)容)具有效率和成本上的優(yōu)勢。
在去年的AI熱營銷峰會上,百度就重點介紹了自家的AIGC內(nèi)容工具,并表示“未來,AIGC 將顛覆現(xiàn)有內(nèi)容生產(chǎn)模式,可以實現(xiàn)以十分之一的成本,以百倍千倍的生產(chǎn)速度,創(chuàng)造出有獨特價值和獨立視角的內(nèi)容”。
而更進一步,AIGC的發(fā)展又能讓web3的世界更清晰,甚至于AIGC 會成為 web3 基礎(chǔ)的技術(shù)架構(gòu)。因為web3所強調(diào)的“人人都是互聯(lián)網(wǎng)的中心,互聯(lián)網(wǎng)數(shù)據(jù)的所有權(quán)歸于每個人”,正是需要工具讓每個人都能產(chǎn)生個性化的內(nèi)容。
同樣,在云業(yè)務(wù)上,百度作為一直強調(diào)具有AI差異優(yōu)勢的云廠商,如果把ChatGPT的大模型與云計算結(jié)合,這又會給云市場帶來更多新變量。
微軟已經(jīng)在這樣做了。開發(fā)者可以在微軟云上直接訪問OpenAI的大模型,然后根據(jù)特定業(yè)務(wù)進行調(diào)整,高效低成本地開發(fā)AI應(yīng)用。
當然,技術(shù)能夠提供怎樣的價值,往往在于如何將其封裝進產(chǎn)品,對生成式 AI 也是如此。
十年1000億,百度在深度學習、NLP、語音、大數(shù)據(jù)等技術(shù)研發(fā)上已經(jīng)應(yīng)用到搜索、金融、電動汽車等業(yè)務(wù),但關(guān)于AI的商業(yè)價值還沒有哪個產(chǎn)品能直觀顯示。
早前李彥宏提出的“框計算”概念,想把百度打造成一切信息和服務(wù)的入口,現(xiàn)在看來就是小程序加上ChatGPT。
當技術(shù)已經(jīng)進步,老船長是否還能再次揚帆起航,答案寫在不久的將來。
本文來自投稿,不代表增長黑客立場,如若轉(zhuǎn)載,請注明出處:http://gptmaths.com/quan/90678.html