“整個晉西北都亂成一鍋粥了?!贝藭r此刻,《亮劍》里的這句話用來形容大模型領域的競爭,竟然顯得意外合適。
五月剛剛過半,全球數(shù)得上名號的大模型玩家——包括OpenAI、谷歌、騰訊、阿里、字節(jié)跳動等,突然一窩蜂地拋出大動作,有能力突然全面升級的,有大模型轉(zhuǎn)為開源免費使用的,有價格劇烈下行掀起價格戰(zhàn)的,景象熱鬧非凡。一開始,大家也許只是想在OpenAI預定的發(fā)布會時間湊個熱鬧,沒想到炸出了一堆“大招”。
在這場頗具火藥味兒的軍備競賽中,我們發(fā)現(xiàn),大模型的賽場上,似乎已經(jīng)只剩下中美兩個大國的巨頭還能留名?!氨ㄊ健备偁幈澈?,是整個領域遲遲找不到合理商業(yè)模式的困境?;蛟S,巨頭們要因此“瘋狂”起來了。
01
「大模型突發(fā)“爆炸式”競爭」
世上的事,最怕一個“巧”字。阿里肯定會有這種想法,因為5月這輪技術(shù)大爆炸,居然是它開頭的。
5月9日,阿里云正式發(fā)布通義千問2.5,模型性能全面趕超GPT-4 Turbo。在通稿中,阿里直接用上了“地表最強中文大模型”的形容,中國大模型因此進入與國外一流大模型一較高低的競技場中央。而在開源領域,通義千問1100億參數(shù)開源模型在多個基準測評收獲最佳成績,超越Llama-3-70B,同樣成為行業(yè)最強。
彼時,距離OpenAI發(fā)布會還有一周時間,阿里估計自己也沒想到,七天后,全球大模型領域巨頭突然集體狂飆:
5月14日,李開復領導的零一萬物正式發(fā)布千億參數(shù)規(guī)模的 Yi-Large閉源大模型,斯坦福評測機構(gòu) AlpacaEval 2.0的排行榜上,Yi-Large 模型的英語能力主要指標僅次于 GPT-4 Turbo,Win Rate 登頂世界第一。
無獨有偶,李開復也說,一年前的中國大模型相比美國太落后,現(xiàn)在已經(jīng)趕上,且零一萬物的下一代大模型要沖擊GPT-5的水平。
緊接著,王炸登場。5月14日,OpenAI凌晨發(fā)布最新旗艦大模型GPT-4o,它是聽說讀畫都全能,甚至可以根據(jù)正在對話的人的語氣和狀態(tài),自主調(diào)節(jié)回復邏輯,全模態(tài)真人交互跟“成精了”一樣。而更讓業(yè)界震驚的是,它居然免費,付費則可以獲得五倍的使用容量。OpenAI說,GPT-4o的“o”就是“omni”的意思,包羅萬象——野心可太大了。
轉(zhuǎn)眼天亮,中國玩家又跟上節(jié)奏了。騰訊于5月14日白天宣布,和Sora同架構(gòu)的混元文生圖大模型直接開源,免費商用。評測數(shù)據(jù)顯示,這可是目前效果最好的開源文生圖模型。騰訊這個動作,倒是很有其一貫的風范,你們都卷是吧,我直接把使用門檻取消,先搶用戶再說。
白日落幕,5月15日凌晨,谷歌召開2024 I / O 開發(fā)者大會。這是一場很急的大會,因為谷歌一口氣扔出來十多款產(chǎn)品,堪稱AI“大亂燉”,目的就是狙擊OpenAI。其中,包括Gemini 1.5 Pro正式開放給訂閱了Geminni Advance的用戶,上下文窗口拓展到200萬token,推出開源模型Gemma2.0、文生圖像模型Imagen3、視頻生成模型Veo等。
5月15日下午,字節(jié)跳動上場了。在2024 春季火山引擎Force原動力大會上,字節(jié)發(fā)布豆包大模型家族,同樣包括多模態(tài)大模型。豆包就是原來的云雀大模型,據(jù)字節(jié)披露,目前豆包大模型日均處理1200億Tokens文本,生成3000萬張圖片,全平臺用戶超過2600萬,應用下載量也位居AIGC行業(yè)第一。
僅僅是總結(jié)這些巨頭的發(fā)布動作,便已經(jīng)讓人看花了眼。要知道,這里面還不包括那些不發(fā)新品,但是開打價格戰(zhàn)的鐵血玩家們。從年初Kimi的爆火開始,大模型領域的熱度和討論度似乎又到了新的臺階,所有大廠都在此時用實際行動表態(tài):過去一年,它們都在養(yǎng)精蓄銳?,F(xiàn)在,巨頭要讓大模型領域燃起硝煙了。
02
「混亂之中,寡頭格局已成型」
其實,從這些動態(tài)中,我們也能讀到一點別的意味:中國和美國的大模型巨頭,基本上是在每天輪流唱大戲。白天中國公司放消息,晚上美國公司又頂上,這才連續(xù)震撼了行業(yè)。而這個過程呢,隨便哪個名字都是行業(yè)里無人不知無人不曉的。其實,這就是兩個趨勢了。
第一個趨勢,是大模型行業(yè)的寡頭格局已經(jīng)形成了。典型的特征是,上述炸場動態(tài)基本都是巨頭大模型產(chǎn)品的重磅升級迭代或者商業(yè)上的重要變化,并沒有哪個新玩家蹭上這波熱度。
實際上,對一個剛剛火起來沒多久的行業(yè)來說,這么快進入寡頭競爭有點讓人驚訝。但考慮到大模型發(fā)展本質(zhì)上是算力、數(shù)據(jù)、算法三方面的大比武,只有巨頭和資源能力強的玩家能做,也并不奇怪。一開始,這個行業(yè)就只給很少的企業(yè)留了機會。像Kimi這樣有點技術(shù)的,也是靠著差異化的長文本打法才有機會成長起來,結(jié)果也迅速讓阿里、百度等巨頭比下去了。
第二個趨勢,就是國家問題了。大模型的國際態(tài)勢已經(jīng)很明顯了,和互聯(lián)網(wǎng)差不多,又是“美領跑,中緊跟,其他區(qū)域跟不上”的態(tài)勢。唯一一個可以算得上例外的,應該是歐洲獨角獸Mistral AI。但是,這家公司能有個競爭位置,依然是因為OpenAI看好它。這個行業(yè),確實沒有中美之外的其他可能性了。
所以,我們不如來想一想,假設現(xiàn)在的寡頭們都能繼續(xù)走下去,他們會怎么塑造市場格局?贏者通吃還是多個贏家并存?這比較難判斷,但要說大模型能一直“無序”競爭,資源肯定是不足的,至少英偉達連顯卡都生產(chǎn)不過來。既然這樣,通過對大模型領域進行分層,我們可以略微推導一下這些公司的發(fā)展方向。
一方面,是行業(yè)大模型和基礎大模型的分層。這次一起拱火的巨頭們,都是基礎大模型的一把好手,所以我們不妨看看沒有蹭這次熱度的大模型玩家在做什么——像科大訊飛、商湯等大模型玩家,其實已經(jīng)在重點發(fā)展行業(yè)賽道??拼笥嶏w星火大模型,和商湯日日新大模型,都已經(jīng)在汽車、教育、工業(yè)等賽道探索落地。而今天字節(jié)的發(fā)布會上,字節(jié)也請來了捷途汽車相關(guān)部門負責人等,講述大模型的行業(yè)應用,并發(fā)布智能終端大模型聯(lián)盟,矩陣式進攻。
其實,這是一條不錯的路。“基礎大模型→行業(yè)大模型→終端應用”,是行業(yè)比較認可的發(fā)展路線?;A大模型非常吃資源,也就是超級巨頭才卷得過。而行業(yè)更需要垂直領域的Know-How,懂行業(yè)、懂客戶,就能取得一定的成果。
另一方面,是開源大模型和閉源大模型的交鋒。OpenAI和谷歌為代表的巨頭,采用閉源大模型,而阿里、騰訊、Meta、Mistral AI,都在開源上下功夫。要強調(diào)的是,這并不絕對,比如Meta和Mistral AI都是主要把精力放在開源上,而阿里騰訊都是兩者兼有,但對開源的態(tài)度很開放。OpenAI則是關(guān)起門來自己玩的純閉源選手。
至于為什么要開源,或者要兩手把握,原因就像前面說騰訊的時候提到的那樣,開源模型意味著垂直行業(yè)的公司想用,就不用從頭訓練大模型,其實間接減少了對閉源大模型的需求——作為巨頭,我閉源干不過你,直接讓用戶先用上便宜好用的大模型也可以,你的客戶少了,我反正更安全。
說到底,現(xiàn)在大模型并沒有一個真正意義上特別穩(wěn)定的商業(yè)模式,賣會員、賣行業(yè)大模型,都只是階段性嘗試而已。整個階段,這些巨頭一方面在想搶客戶,另一方面其實需要防備客戶太傾向哪個大模型。于是,我們就在這場集體爆發(fā)里,看到了這么多的“拉扯”。
03
「拼落地,商業(yè)模式仍缺思考」
那么,現(xiàn)在大模型行業(yè)對商業(yè)模式的思考和探索,具體到哪一步了?現(xiàn)在,它們有什么明確的競爭焦點了嗎?這些問題,都是有答案的。
先來看最基礎的商業(yè)模式表現(xiàn),雖說行業(yè)確實有點迷茫,但正面的進展是不少的。比如,字節(jié)跳動豆包平臺上已經(jīng)有超過800萬個智能體被創(chuàng)建,2600萬的用戶量也在行業(yè)高度領先;零一萬物透露,其海外生產(chǎn)力應用總用戶接近千萬,今年C端單一產(chǎn)品收入已經(jīng)達到1億元;通義通過阿里云服務企業(yè)超過9萬、通過釘釘服務企業(yè)超過220萬,就連小愛同學也和阿里牽手;百度則表示,已經(jīng)有近10萬家企業(yè)調(diào)用文心一言能力,百度文庫的AI能力,每天有250萬用戶都在用。
說起來,商業(yè)化無非就是兩派——GPT、Kimi、文心一言會員、豆包等平臺上的智能體,都是C端應用的代表;反之,阿里把通義大模型嵌入釘釘、科大訊飛和商湯給客戶定制的行業(yè)大模型,則是B端應用的代表。出現(xiàn)這種劃分,其實也就是公司基因的繼承,像阿里、騰訊、字節(jié)等公司本身就是雙端業(yè)務拓展,B端和C端自然都能做,而商湯這種一開始就做B端業(yè)務的公司,要用AI拿到新訂單也更容易。
所以,嚴格來說,大模型的商業(yè)化落地其實要思考“AI+”(以AI技術(shù)賦能行業(yè)的科技企業(yè))還是“+AI”(采用AI技術(shù)的傳統(tǒng)企業(yè))的問題。目前,無論是GPT這種“技術(shù)即產(chǎn)品”的方式,還是阿里、科大訊飛定制化和嵌入化的方式,目前都沒有突破傳統(tǒng)商業(yè)模式的范疇,估計不一定是大模型的終極形態(tài)。
更嚴峻的問題是,我們必須承認,當阿里、騰訊都在開源,當GPT的能力、谷歌Gemini的能力都有所重合,無論B端還是C端客戶,選擇單一大模型的動力其實有點弱了。因為大模型的基礎能力都差不多,無非是這個月我第一,下個月你第一,很難分出差異來。這個時候,競爭的焦點其實不在能力上。
在哪呢?QuestMobile數(shù)據(jù)顯示,截至今年3月,基于大模型的AIGC行業(yè)用戶量為7380萬,和移動互聯(lián)網(wǎng)幾十億用戶比起來真是“灑灑水”的程度。為什么大眾沒那么樂意用呢?因為開源模型要部署,而收費的模型真的不便宜。文心一言的用戶數(shù)已經(jīng)突破2億,專業(yè)版連續(xù)包月也要49.9元一個月,你說其中能有多少付費會員?
如果用戶規(guī)模不夠,從實戰(zhàn)收回的反饋數(shù)據(jù)就不夠,大模型要向能用、好用的水平發(fā)展,就會更麻煩。所以,為了讓大模型加速落地,價格戰(zhàn)已經(jīng)打起來了。
行業(yè)其實有個平均水平,0.12元/千tokens。但是,這根本限制不了巨頭大降價的決心。
字節(jié)是個狠人,豆包模型在企業(yè)市場的定價低到了0.0008元/千tokens,比行業(yè)均價便宜99.3%。炸場的OpenAI價格也很炸裂,API價格打五折,速度還提高一倍,新推出的text-embedding-3-small模型,價格僅為上一代的五分之一,每1000個tokens的價格從0.0001美元降低到0.00002美元。
另外還有一些默默用價格卷同行的玩家,比如智譜AI,入門級產(chǎn)品GLM-3 Turbo,一塊錢就能買100萬tokens。
為什么卷生卷死?還不是因為單純的技術(shù)競爭,其實已經(jīng)暫時無法出現(xiàn)質(zhì)的變化,最大的代表就是,OpenAI的GPT-4o很驚艷?很可能是GPT-5有點難產(chǎn),才只能用這種進步來搪塞一下市場。
而大模型壞就壞在,這個領域太新了,如果沒有新的技術(shù)把水攪渾,一旦用戶開始習慣了用某個大模型,市場格局就會很危險。所以,沒有人希望這個領域太冷清,越熱鬧、越瘋狂,才能保證自己不被洗出局。這個領域沒有“王”,不管中國公司還是美國公司,比的就是誰敢闖、誰更狂。
– END –
本文來自投稿,不代表增長黑客立場,如若轉(zhuǎn)載,請注明出處:http://gptmaths.com/cgo/market/117955.html