實(shí)測(cè)文心一言,百度可以再自信一點(diǎn)

優(yōu)勢(shì)非虛,打臉了誰(shuí)?

撰文?| 吳先之? ?文燁豪??

編輯?| 王? ?潘

不到一年時(shí)間,AI完成了從“袪魅”,到重回主流、再度引發(fā)“恐慌”的逆襲。

隨著AIGC應(yīng)用愈發(fā)成熟,不僅科技語(yǔ)境涌起新一輪浪潮,一直同AI略顯疏離的C端用戶亦被不斷刷新著認(rèn)知。當(dāng)下,不論是投資圈,還是學(xué)術(shù)界,抑或是普通用戶,幾乎所有人的目光都聚焦在了生成式AI產(chǎn)品身上。

顯然,2023年,屬于AIGC的時(shí)代已然到來(lái)。但縱觀行業(yè),大眾討論的核心始終沒有脫離那幾款明星產(chǎn)品,國(guó)內(nèi)部分企業(yè)雖表示正在布局,大多停留于概念層面,鮮有真正拿出成果的玩家——直至百度下場(chǎng),局面有所逆轉(zhuǎn)。

3月16日下午,百度發(fā)布廳內(nèi),李彥宏親自上臺(tái),將外界期待許久的文心一言端上了臺(tái)面。從發(fā)布會(huì)現(xiàn)場(chǎng)演示來(lái)看,文心一言在面對(duì)五個(gè)典型的使用場(chǎng)景時(shí)表現(xiàn)得不錯(cuò),回答的準(zhǔn)確性、邏輯性、流暢性均接近人類水平。耕耘AI多年的百度,或許即將迎來(lái)屬于自己的時(shí)刻。

?

文心一言:百度AI十幾年荊棘闖出的結(jié)果

細(xì)數(shù)國(guó)內(nèi)互聯(lián)網(wǎng)語(yǔ)境,百度無(wú)疑是在AI領(lǐng)域扎根最深的玩家之一。早在十年前,百度便已將未來(lái)的飛輪押注在了AI上面。

2010年,當(dāng)玩家們還在思索如何通過(guò)互聯(lián)網(wǎng)思維改造傳統(tǒng)行業(yè)時(shí),百度便已成立了自然語(yǔ)言處理部,開始了對(duì)自然語(yǔ)言處理NLP的探索。而過(guò)去十多年間,在視覺識(shí)別、自動(dòng)駕駛等AI更為廣闊的落地領(lǐng)域,幾乎也都遍布著百度的身影。

只是,科技發(fā)展需要跨越裂谷,正如千禧年的互聯(lián)網(wǎng)的崩潰,以及后來(lái)云計(jì)算遭冷落等,前沿技術(shù)研發(fā)及落地過(guò)程中往往充滿著痛苦,即便是OpenAI,也難逃多年苦坐“冷板凳”,百度AI亦曾陷入過(guò)單邊投入的長(zhǎng)周期之中。

而文心一言,正是百度這十多年AI路,踩著“荊棘”所闖出的結(jié)果。

2019年3月,文心一言背后的文心大模型ERNIE1.0首次亮相,并登頂了全球權(quán)威數(shù)據(jù)集GLUE榜單。此后,其不斷升級(jí)迭代,從自然語(yǔ)言延伸至視覺、語(yǔ)音等多模態(tài),直到最新的ERNIE3.0 Zeus模型,已然具備了千億級(jí)參數(shù)。換言之,百度能夠搶跑國(guó)內(nèi)AIGC賽道,絕非偶然。

而切入正題,文心一言實(shí)際表現(xiàn)到底如何?發(fā)布會(huì)上,李彥宏通過(guò)文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理推算、中文理解、多模態(tài)生成五個(gè)場(chǎng)景下的Demo,向外界秀了一把肌肉。

以數(shù)理邏輯推算為例,其向文心一言拋出了經(jīng)典的雞兔同籠問(wèn)題,并在提問(wèn)中埋下了彩蛋——即誤導(dǎo)性的提問(wèn)。而經(jīng)過(guò)演算,文心一言非但沒有踩坑,反倒指出了題目出現(xiàn)了錯(cuò)誤,且在面對(duì)正確的題目時(shí),給出了正確結(jié)果及解題步驟。

如果說(shuō),頂級(jí)廠商大模型均具備的數(shù)理邏輯推算能力,尚不足以證明文心一言的能力,那么其關(guān)于“洛陽(yáng)紙貴”的表達(dá),則令人眼前一亮。畢竟中文語(yǔ)境較為復(fù)雜,漢字?jǐn)?shù)量較多,即便是ChatGPT,面對(duì)中文時(shí)偶爾也會(huì)出現(xiàn)詞不達(dá)意,言不由衷的情況。

以“用洛陽(yáng)紙貴四個(gè)字寫一首藏頭詩(shī)”為例,文心一言稍加思索,寫下了“洛陽(yáng)城里春光好,陽(yáng)艷無(wú)雙不負(fù)賞。紙貴漫天詩(shī)詞賦,貴比黃金樂(lè)未央?!?/p>

這首詩(shī)雖談不上有多少文學(xué)、審美價(jià)值,但至少兢兢業(yè)業(yè)地按照要求完成了創(chuàng)作。相比之下,ChatGPT似乎并沒有很好地理解“藏頭詩(shī)”的含義。

從中不難窺見文心一言的中文理解能力。顯然,在中文語(yǔ)境里,具備搜索優(yōu)勢(shì)的百度擁有“主場(chǎng)優(yōu)勢(shì)”,有著更多的中文語(yǔ)料數(shù)據(jù)參與訓(xùn)練,自然也有著更為成熟的結(jié)果。

總之,就發(fā)布會(huì)來(lái)看,文心一言的表現(xiàn)優(yōu)秀。

實(shí)測(cè)文心一言:優(yōu)勢(shì)非虛

或許是早已習(xí)慣了國(guó)內(nèi)玩家的PPT發(fā)布會(huì),外界對(duì)發(fā)布會(huì)上文心一言的表現(xiàn)褒貶不一,甚至有一種聲音認(rèn)為“Demo并非實(shí)時(shí)提問(wèn),其中有一定的‘修飾’空間”。

對(duì)此,光子星球拿到了文心一言的內(nèi)測(cè)資格,并第一時(shí)間測(cè)試了其實(shí)際表現(xiàn)。先說(shuō)結(jié)論,就當(dāng)前版本的文心一言而言,仍有提升的空間,但整體表現(xiàn)超出了我們此前的預(yù)期。

首先是百度重點(diǎn)展現(xiàn)的中文理解領(lǐng)域,從燒烤店老板的視角分別向文心一言和ChatGPT提出相同的問(wèn)題。

實(shí)測(cè)文心一言,百度可以再自信一點(diǎn)

提問(wèn)是東北燒烤,但ChatGPT的回答似乎有些驢頭不對(duì)馬嘴,將串串香、烤鴨等五湖四海的美食匯聚一堂。相比之下,文心一言的回答不僅到位許多,甚至還呈現(xiàn)出了不同答案的取名邏輯。

實(shí)測(cè)文心一言,百度可以再自信一點(diǎn)

同樣的邏輯,在貼合本地文化的網(wǎng)吧取名中同樣有所體現(xiàn)。文心一言的回答,顯然比ChatGPT毫無(wú)邏輯的回答要精準(zhǔn)。

實(shí)測(cè)文心一言,百度可以再自信一點(diǎn)
實(shí)測(cè)文心一言,百度可以再自信一點(diǎn)

此外,在發(fā)布會(huì)展現(xiàn)的藏頭詩(shī)創(chuàng)作方面,文心一言對(duì)內(nèi)容的理解亦優(yōu)于ChatGPT。

實(shí)測(cè)文心一言,百度可以再自信一點(diǎn)
實(shí)測(cè)文心一言,百度可以再自信一點(diǎn)

由此可見,文心一言對(duì)于自己“更理解中國(guó)文化,更適合中文語(yǔ)境和中國(guó)市場(chǎng)”的表述,不是一句空談。

相對(duì)復(fù)雜的數(shù)理邏輯推算場(chǎng)景,我們亦向兩款產(chǎn)品提出了比發(fā)布會(huì)“雞兔同籠”更繞的問(wèn)題——“如果3個(gè)人3天能做3個(gè)燈籠,那么9個(gè)人9天,能做多少個(gè)燈籠?(正確答案是27個(gè))”

或許是該問(wèn)題涉及到更多中文理解,強(qiáng)如ChatGPT也給出了錯(cuò)誤的回答,直到多番糾錯(cuò)才勉強(qiáng)回答正確。文心一言的表現(xiàn)雖與之類似,但其在5次提問(wèn)里,直接回答正確了2次。

而在發(fā)布會(huì)并未透露的編程領(lǐng)域,面對(duì)編寫“俄羅斯方塊”代碼的要求,文心一言在Python里洋洋灑灑地寫下了88行代碼。在交由一位程序員朋友檢查后,其稱文心一言所寫的代碼整體并沒有太大的毛病。

實(shí)測(cè)文心一言,百度可以再自信一點(diǎn)

圖片創(chuàng)作領(lǐng)域,文心一言所生成的圖片基本符合描述。

實(shí)測(cè)文心一言,百度可以再自信一點(diǎn)

此外,我們還測(cè)試了其撰寫商業(yè)稿件、提煉內(nèi)容等能力,受限于篇幅無(wú)法全然呈現(xiàn)。

總而言之,文心一言在面對(duì)前述場(chǎng)景時(shí),具備一定的準(zhǔn)確性、邏輯性,中文理解部分優(yōu)于ChatGPT。

雖然只是內(nèi)測(cè)版本,但文心一言的表現(xiàn)相當(dāng)成熟。而隨著后續(xù)迭代更新,這一款寄托著外界“國(guó)產(chǎn)ChatGPT”期許產(chǎn)品很可能將迎來(lái)光明的未來(lái)。

?

百度AI的新征程

現(xiàn)階段,無(wú)論是OpenAI的GPT“家族”,還是百度的文心一言,抑或是更為廣闊的AIGC賽道,仍處于前期的技術(shù)沉淀階段。正如李彥宏發(fā)布會(huì)所說(shuō),大語(yǔ)言模型還遠(yuǎn)未到發(fā)展完善的階段,有賴于通過(guò)真實(shí)的用戶反饋而逐步迭代。

在這一輪博弈里,只有盡早地?fù)屨忌砦?,才能積攢起更多用戶,從而收集更多數(shù)據(jù),推動(dòng)產(chǎn)品迭代升級(jí)。

只是,不同于一夜迸發(fā)的“商業(yè)靈感”,技術(shù)領(lǐng)域的演進(jìn)從始至終都需要堆砌金錢與時(shí)間。

一位業(yè)內(nèi)人士指出,像ChatGPT、文心一言這樣的產(chǎn)品,需要大量頂尖人才,特別燒錢,而且還需要時(shí)間沉淀,初創(chuàng)企業(yè)想要分羹極為艱難,盲目進(jìn)場(chǎng)極有可能陷入“重復(fù)制造輪子”的窘境。

也因如此,李彥宏才會(huì)在發(fā)布會(huì)上表示:“無(wú)論是哪家公司,都不可能靠突擊幾個(gè)月就能做出這樣的大語(yǔ)言模型?!?/p>

另一方面, AIGC賽道的玩家在打磨產(chǎn)品的同時(shí),亦需思考如何跑通商業(yè)化之路,畢竟諸如語(yǔ)音識(shí)別、視覺系A(chǔ)I等“前輩”們,或多或少都經(jīng)歷過(guò)商業(yè)化長(zhǎng)夜。

究其所因,任何新興技術(shù)想要突破“商業(yè)化瓶頸”,關(guān)鍵點(diǎn)均在于“應(yīng)用”,即滿足用戶、公司乃至行業(yè)的實(shí)際需求。這既是GPT-4接入Office的原因,亦是百度向百度智能云企業(yè)客戶開放文心一言API接口調(diào)用服務(wù)的原因。

而從當(dāng)下的局面來(lái)看,強(qiáng)調(diào)中文語(yǔ)境的文心一言,似乎已經(jīng)得到了國(guó)內(nèi)市場(chǎng)B端用戶的認(rèn)可。數(shù)據(jù)顯示,自2月份百度官宣“文心一言”以來(lái),已有超過(guò)650家企業(yè)宣布接入文心一言生態(tài)。截至3月17日12點(diǎn),申請(qǐng)文心一言API調(diào)用服務(wù)測(cè)試的企業(yè)已達(dá)8萬(wàn)——搶跑的百度,正在試圖建立全新的商業(yè)秩序。

歸根結(jié)底,科技迭代、下潛之路從來(lái)不是一帆風(fēng)順,唯有翻越重重大山,才能看到曙光。而在當(dāng)下這個(gè)愈發(fā)激烈的競(jìng)爭(zhēng)語(yǔ)境里,至少在國(guó)內(nèi),百度很可能將成為第一批吃到螃蟹的玩家。

本文來(lái)自投稿,不代表增長(zhǎng)黑客立場(chǎng),如若轉(zhuǎn)載,請(qǐng)注明出處:http://gptmaths.com/quan/93496.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
上一篇 2023-03-17 19:35
下一篇 2023-03-17 22:29

增長(zhǎng)黑客Growthhk.cn薦讀更多>>

發(fā)表回復(fù)

登錄后才能評(píng)論