作者?| 陳出木
我們目前沒有訓(xùn)練 GPT-5,也不會在短期內(nèi)進(jìn)行訓(xùn)練。
近日,在麻省理工學(xué)院舉辦的“The Future of Business with AI”論壇上,OpenAI的首席執(zhí)行官Sam Altman首次回應(yīng)《暫停AI巨型實(shí)驗(yàn)》的公開信。按照這位“ChatGPT之父”的說法,“建更大的模型,喂更多的數(shù)據(jù)”已經(jīng)不能奏效,GPT-4的硬件條件也到了天花板。
但ChatGPT自發(fā)布以來掀起的科技軍備戰(zhàn)并沒有停息,其余威在國內(nèi)愈演愈烈,各公司在AI領(lǐng)域卷生卷死,各種大模型集中爆發(fā),頗有十年前“千團(tuán)大戰(zhàn)”的氣勢。相比此前數(shù)千家團(tuán)購賽道玩家瘋狂燒錢,每一位“百模大戰(zhàn)”的參與者都在爭奪時間,試圖讓自己提前出線。
原本,國內(nèi)的這波“百模大戰(zhàn)”或許不會來得這么快,但在國外的ChatGPT掀起AI熱潮之后,壓力給到了國內(nèi)的科技公司。為了順勢提前卡位,各家都選擇且不管能否實(shí)戰(zhàn),先把成果端出來溜溜。在媒體報道中,它們都屬于“類ChatGPT產(chǎn)品”。
在百度打響AI大模型內(nèi)卷第一槍之前,大多還是小打小鬧。小公司的數(shù)據(jù)庫不夠,開發(fā)的AI大模型訓(xùn)練不足;大公司則只停留在放出風(fēng)聲的階段,阿里聲稱可能將AI大模型技術(shù)與釘釘深度結(jié)合,騰訊則表示成立“混元助手(HunyuanAide)”項(xiàng)目組來構(gòu)建大參數(shù)語言模型。
直到2月7日,百度在公眾號官宣將推出大模型新項(xiàng)目文心一言(ERNIE Bot)。消息一出,全網(wǎng)翹首以盼,坐等百度大招。
沒想到的是,在3月16日文心一言新聞發(fā)布會召開的前一天,GPT-4重磅推出,百度此前鋪墊的熱度為他人做嫁衣,還因?yàn)镚PT-4的功能升級而被架到了毫無退路的期待高位上。
熱鬧之中,相比發(fā)布會開始之前的眾望,發(fā)布會開始之后鋪天蓋地的吐槽,諸如功能不驚艷、使用提前錄制的演示案例、需要邀請碼才能體驗(yàn)等問題,讓文心一言在AI領(lǐng)域的路人盤岌岌可危,甚至被嘲“ChatPPT”。
而當(dāng)時百度創(chuàng)始人李彥宏關(guān)于“百度文心一言和OpenAI差距可能在兩個月左右”的說法,在后來搜狗創(chuàng)始人王小川官宣與前搜狗COO茹立云聯(lián)合創(chuàng)立的AI大模型公司“百川智能”之際,又被翻出來作為雙方隔空掐架的主題。很難想象,我們在2023年還能看到巨頭們互懟對方脫離一線。
但這只是“百模大戰(zhàn)”的冰山一角,過程中有無數(shù)公司或趕來入局,或官宣蟄伏的產(chǎn)品。無一例外的是,它們都吸取了百度翻車的教訓(xùn)——拒絕高調(diào)直播,盡量配備現(xiàn)場實(shí)測。
阿里達(dá)摩院先是低調(diào)地在魔搭社區(qū)(ModelScope)放出了“文本生成視頻大模型”(體驗(yàn)鏈接:https://modelscope.cn/studios/damo/text-to-video-synthesis/summary)。
至4月7日,阿里云推出專門響應(yīng)人類指令的語言大模型“通義千問”,面向企業(yè)及邀請用戶開放,并表示在月底逐步開放文字生成圖像產(chǎn)品“通義萬相”。此外,旗下的AIGC交互系統(tǒng)和個性化大模型“鳥鳥分鳥”也將向行業(yè)開放。
實(shí)際上,阿里巴巴在大模型領(lǐng)域并非新手。其曾在2019年推出LLM模型(Large language model大語言模型)PLUG,在2021年官宣了多模態(tài)大模型M6,后者至今沒有對公眾開放,但據(jù)悉已在旗下產(chǎn)業(yè)應(yīng)用。
目前,BAT已有兩家下場競賽,剩下的騰訊則另辟蹊徑,于4月14日發(fā)布面向大模型訓(xùn)練的新一代HCC(High-Performance Computing Cluster)高性能計(jì)算集群。顯然,騰訊瞄準(zhǔn)的是大模型最容易被卡脖子的算力問題。
躋身互聯(lián)網(wǎng)大廠新貴的字節(jié)跳動也沒閑著,旗下的火山引擎在4月18日發(fā)布自研DPU等系列云產(chǎn)品,并推出新版機(jī)器學(xué)習(xí)平臺,支持企業(yè)客戶更好地訓(xùn)練AI大模型。根據(jù)火山引擎總裁譚待透露,“國內(nèi)大模型領(lǐng)域的數(shù)十家企業(yè),超過七成已經(jīng)在火山引擎云上?!?/p>
顯然,搞基層的這兩家未來必會有短兵交接的時候。
此外,據(jù)微果醬不完全統(tǒng)計(jì),近期往大模型方向伸手的包括但不限于:
3月29日,三六零發(fā)布360gpt“翻車”,十天后宣布“360智腦”落地搜索場景。 4月8日,華為公開“盤古大模型”的進(jìn)展,或?qū)⑸暇€。 4月10日,昆侖萬維宣布合作奇點(diǎn)智源的大語言模型“天工3.5”將發(fā)布。 4月10日,商湯科技公布大模型體系“日日新SenseNova”。 4月13日,知乎合作面壁智能發(fā)布中文大模型“知海圖AI”。 4月20日,科大訊飛宣布將于5月6日發(fā)布訊飛星火認(rèn)知大模型(https://xinghuo.xfyun.cn/)。 4月20日,出門問問宣布內(nèi)測大模型“序列猴子”。 4月21日,復(fù)旦大學(xué)的新版MOSS模型上線(https://moss.fastnlp.top/)。 ……
如此密集的新品官宣場面,讓沉寂已久的科技圈沸騰了起來,也足以讓你對AI熱潮有更具象的認(rèn)知。毋庸置疑,“百模大戰(zhàn)”一觸即發(fā)。
所有產(chǎn)品都值得用大模型重做一遍。
在2023年阿里云峰會上,阿里巴巴集團(tuán)董事會主席兼CEO張勇喊出如此口號。
這樣的說法在近幾年常常耳聞,每時興一種事物,所有產(chǎn)品、產(chǎn)業(yè)都能用其邏輯再做一遍,現(xiàn)在輪到大模型了。
放到應(yīng)用層面來理解,每個玩家都期待借著這個風(fēng)口,把自家產(chǎn)品包裝一下再重新推廣出去。所以,目前各家的大模型都與本身業(yè)務(wù)類型相關(guān),比如360智腦率先落地搜索場景,知海圖AI的首個功能“熱榜摘要”將對知乎熱榜的問答進(jìn)行抓取并把梗概整合給用戶。
這種風(fēng)向在一定程度上說明了國內(nèi)“百模大戰(zhàn)”的實(shí)質(zhì)——相比底層技術(shù)的成熟程度,大家更加關(guān)注其應(yīng)用的有效性。也就是說,當(dāng)前大模型的內(nèi)卷說到底仍然是互聯(lián)網(wǎng)企業(yè)主流業(yè)務(wù)的競爭,大模型的輔助作用更像是跟風(fēng)的宣傳噱頭。
4月18日,釘釘、WPS、印象筆記在同一天官宣“AI辦公助手”,再加上相距一周前飛書發(fā)布的“My AI”,都是大模型能力在辦公場景的落地。這便是“百模大戰(zhàn)”實(shí)質(zhì)的力證之一,各家沒有將推廣筆墨花在背靠的大模型上,用戶也并不關(guān)心,大家都聚焦在產(chǎn)品應(yīng)用,實(shí)用才是硬道理。
所以,從初始提大模型必帶參數(shù),到現(xiàn)在推出大模型只說明能如何應(yīng)用,真正把大模型做出聲量的并不多。在這種情況下,諸如出門問問創(chuàng)始人李志飛等大佬,思路也從做通用型大模型轉(zhuǎn)向做結(jié)合自身業(yè)務(wù)場景的垂直整合大模型。
另一方面,“百模大戰(zhàn)”實(shí)際上卷的還是各家多年技術(shù)積淀的實(shí)力,所以也體現(xiàn)為大家仍是在自己擅長的領(lǐng)域進(jìn)階的情況。
就像OpenAI公司在發(fā)布ChatGPT之前已經(jīng)深耕行業(yè)八年,微軟先后投資高達(dá)100億美元,OpenAI對于GPT-3的訓(xùn)練費(fèi)用超1200萬美元,“每次訓(xùn)練消耗的電力足夠3000輛特斯拉汽車每輛跑20萬英里?!?/p>
國內(nèi)“百模大戰(zhàn)”的玩家們應(yīng)當(dāng)對這個賽道的巨額成本深有體會,所以除了頭部的幾家企業(yè),余者還是從自己擅長的產(chǎn)品出發(fā)做結(jié)合。當(dāng)前能夠把成果真正拿出手的寥寥,而它們大多已經(jīng)在自己當(dāng)霸主的領(lǐng)域發(fā)展多年,沉淀了海量數(shù)據(jù)。
實(shí)際上,“百模大戰(zhàn)”發(fā)展至今,滿打滿算才三個月左右,競爭卻按天論計(jì)?,F(xiàn)階段“百模大戰(zhàn)”的實(shí)質(zhì)釋放出一些關(guān)乎未來的信號,我們不妨大膽預(yù)測:
1、“百模大戰(zhàn)”的后期會變成寡頭相持
由于算力、資金、技術(shù)門檻存在,能在大模型內(nèi)卷中走到最后的或許還是資本實(shí)力和科技積累更加深厚的巨頭們,新生選手面臨更大的競爭困難。
2、“百模大戰(zhàn)”的升級天花板有限
算力限制讓GPT的發(fā)展都有所保留,“百模大戰(zhàn)”的最后必然需要直面這個問題,在追趕GPT的路上能走多遠(yuǎn)或許與客觀條件有更強(qiáng)的相關(guān)性。
3、“百模大戰(zhàn)”的結(jié)局將回歸產(chǎn)品深化
巨頭們不會輕易放棄原有的優(yōu)勢賽道,大模型之爭最終會落到產(chǎn)品應(yīng)用場景,為“產(chǎn)品+AI”提供支持,加固原有的產(chǎn)品護(hù)城河。
4、“百模大戰(zhàn)”將延伸出更多垂直模型競賽
近來,國外大模型的相關(guān)動作就呈現(xiàn)了細(xì)分趨勢,這在一定程度上可以預(yù)示國內(nèi)“百模大戰(zhàn)”的更多可能性:
OpenAI發(fā)布了AI畫圖模型Consistency Models,支持修改現(xiàn)有圖像不需任何額外訓(xùn)練和數(shù)據(jù);英偉達(dá)推出AI視頻生成模型VideoLDM,可以根據(jù)用戶的文本描述自動生成視頻;Meta推出AI模型Segment Anything Model,能根據(jù)文本指令等方式實(shí)現(xiàn)“一鍵摳圖”;微軟則擬推出AI芯片“雅典娜”,為大語言模型提供動力……
綜上所述,國內(nèi)“百模大戰(zhàn)”可以算是ChatGPT掀起AI熱潮的一個縮影,無論是否準(zhǔn)備好,時代已經(jīng)推著所有企業(yè)走到了這一步。就目前來說,大模型們?nèi)匀惶幱凇爸宦勂渎暡灰娖淙恕钡某跫夒A段,旋渦中心的參與者未來必將還有鏖戰(zhàn)。
但對于普通用戶來說,感知到的時候,科技競爭就已經(jīng)決出勝負(fù),最終落地的產(chǎn)品應(yīng)用便是贏家。
本文來自投稿,不代表增長黑客立場,如若轉(zhuǎn)載,請注明出處:http://gptmaths.com/cgo/product/97190.html