沸騰的大模型:誰在成為主角?

新戰(zhàn)場,也是老戰(zhàn)場

 

沸騰的大模型:誰在成為主角?

 

作者/皮爺

出品/新摘商業(yè)評論

 

670.4%——這是在2023年中期業(yè)績報告中,商湯給出的生成式AI相關(guān)業(yè)務(wù)增長數(shù)字。與此同時,今年上半年,商湯整體營收增速轉(zhuǎn)正,實(shí)現(xiàn)收入14.3億元。

商湯,這個AI老兵,再次站到了舞臺中央。

過去半年的大模型浪潮里,如果說在一眾中國選手里誰的身影更為清晰,商湯絕對是最佳選項之一。關(guān)于這家AI原生的企業(yè),市場已經(jīng)看到了太多的亮眼標(biāo)簽。比如商湯是最早發(fā)布大模型系列產(chǎn)品的廠商之一,旗下商量SenseChat是國內(nèi)最早推出的基于千億參數(shù)大語言模型的聊天機(jī)器人產(chǎn)品之一;再比如,商湯聯(lián)合多家國內(nèi)頂尖科研機(jī)構(gòu)發(fā)布了首個綜合性能全面超越GPT-3.5-turbo的基模型InternLM等等。

對于商湯,人們不陌生。但盡管如此,對于如今在大模型潮流里有足夠清晰的聲音傳遞出來的商湯而言,其也在AI加速落地的當(dāng)下不斷刷新著人們對它的新定義。

在如今“百模征戰(zhàn)”的大模型時代,一個經(jīng)常被提出,也更是市場關(guān)心的問題恰是:誰能成為最終的底層大模型選項?或者說,誰能成為中國產(chǎn)業(yè)數(shù)字化浪潮的真正賦能者?

在大模型熱度逐漸冷靜的當(dāng)下,這個問題的答案已然不僅是關(guān)于技術(shù)本身,也更是關(guān)于產(chǎn)品,關(guān)于服務(wù),關(guān)于對產(chǎn)業(yè)的理解和深耕。

而這里,也已然成為商湯們自證價值的最佳考場。

一、AI潮水里,一張新成績單

“商湯迎來了極其關(guān)鍵的發(fā)展時期。”商湯CEO徐立在財報公布的電話會上這樣說道。作為商湯董事會執(zhí)行主席兼首席執(zhí)行官,在過去的半年時間里,他和商湯一起站上了AI的舞臺。

今年5月份,陸奇在北京舉行了一場超千人規(guī)模、主題為《新范式新時代新機(jī)會》的演講,全程超三個小時,其中他的核心觀點(diǎn)是,大模型將帶來范式技術(shù)革命,它將改變一切產(chǎn)業(yè)世界,未來也將無處不在。

在具體的闡述環(huán)節(jié),他也更明確表達(dá),中國大模型企業(yè)要奮起直追,在基礎(chǔ)模型層面,要建立達(dá)到GPT-3.5到GPT-4的模型能力,搶先進(jìn)入第一梯隊。

就在這番話落地的僅1個月后,有一家企業(yè)就宣布其基模型性能超過GPT-3.5-turbo,正是商湯聯(lián)合多家國內(nèi)頂尖科研機(jī)構(gòu)發(fā)布的大語言模型書生·浦語(InternLM),參數(shù)規(guī)模為1040億,成為當(dāng)時國內(nèi)首個在多個權(quán)威評測集上超越ChatGPT水平的基模型。

8月,更新的模型成果被披露,新模型 InternLM-123B 完成訓(xùn)練,參數(shù)量提升至1230億,在全球51個知名評測集共計30萬道問題中測試成績整體排名全球第二,超過GPT-3.5-turbo以及Meta新發(fā)布的LLaMA2-70B等模型。

據(jù)介紹,InternLM-123B的語言、知識、理解、推理和學(xué)科等能力均顯著提高,還重點(diǎn)升級了代碼解釋器及插件調(diào)用能力(function calling),可使用python解釋器、API調(diào)用和搜索三類常用工具來解決復(fù)雜任務(wù)、靈活搭建AI智能體應(yīng)用。

徐立在財報電話會上重申了工具調(diào)用能力的意義。“只會‘聊天’的模型是很難轉(zhuǎn)化成生產(chǎn)力的,能夠準(zhǔn)確使用工具的大模型是解放行業(yè)生產(chǎn)力的關(guān)鍵。”

商湯的文生圖大模型秒畫也在飛速迭代,短短幾個月內(nèi)由1.0版本升級至3.0版本,基模型參數(shù)量提升至70億參數(shù),其核心算法在COCObenchmark上超過了谷歌的Imagen與OpenAI的DALL·E2,出圖效果躋身全球前列。

這僅僅是商湯交出的成績單之一。

更亮眼的成績來自商湯基于基模型的上層表達(dá)。 在基模型之上,除了商量和秒畫,商湯還推出了如影、瓊宇、格物等AI產(chǎn)品,分別對應(yīng)數(shù)字人、3D大場景重建、3D小物體生成這五個主流的生成式AI場景。

這些產(chǎn)品在過去半年時間里不僅被廣泛應(yīng)用到C端,也在一眾B端市場落地。

財報數(shù)據(jù)顯示,今年上半年商湯智慧商業(yè)板塊收入同比增長50.2%,收入占比提升至60%,與十個行業(yè)的數(shù)百家客戶合作定制行業(yè)大模型,覆蓋能源、金融、地產(chǎn)、人力資源、傳媒、工業(yè)制造、咨詢等一眾垂直行業(yè)場景,單客戶收入提高59.9%。

智慧生活板塊的表現(xiàn)同樣亮眼。 商湯在財報中透露,智慧生活已通過對手機(jī)、移動互聯(lián)網(wǎng)行業(yè)上百個客戶提供大模型賦能的新產(chǎn)品及新功能,最終觸達(dá)數(shù)億終端、中小企業(yè)與個人用戶。例如“如影”數(shù)字人如今已服務(wù)于央視、廣電、工商銀行等頭部客戶,并落地各類電商和直播類客戶;“格物”則已與香港最大的珠寶集團(tuán)實(shí)現(xiàn)商品3D數(shù)字化合作等等。

可以說,透過這次財報數(shù)據(jù),能清晰看到的是一根向上的企業(yè)發(fā)展陽線。 在這條勢頭強(qiáng)勁的曲線里,商湯向外界展示的不僅是自身的產(chǎn)品、技術(shù)和產(chǎn)業(yè)落地,更是商湯這家企業(yè)在AI浪潮下被無限放大的戰(zhàn)略活性。

 

為什么商湯可以?或者說,為什么在如今波折不定的大模型潮水里,商湯走出的是一條足夠有確定性的曲線?

二、誰在領(lǐng)跑大模型?

實(shí)際上,這并不是一件容易的事。

從企業(yè)的層面來看,大模型的落地背后對應(yīng)的不僅是其在參數(shù)、產(chǎn)品層面的不斷訓(xùn)練和調(diào)整,更是在一個個產(chǎn)業(yè)場景中基于行業(yè)know-how的沉淀,不斷改進(jìn)和適配,由定制化走向通用場景。

想要實(shí)現(xiàn)真正的AGI,大模型仍要不斷進(jìn)化迭代。這背后需要的則是算力、數(shù)據(jù)、系統(tǒng)等全方位的支撐。

根據(jù)相關(guān)消息顯示,在如今OpenAI基于GPT-4的訓(xùn)練中,其參數(shù)量級達(dá)1.8萬億巨量參數(shù),訓(xùn)練一次的成本則是高達(dá)6300萬美元,甚至不止。其中不僅包括單純的邏輯推理,更包括如數(shù)據(jù)清洗、高質(zhì)量數(shù)據(jù)標(biāo)注等等環(huán)節(jié)。

但商湯卻有另外一條路。其頗具前瞻性的布局打造了算力基礎(chǔ)設(shè)施SenseCore AI大裝置。2022年全國最大智算中心上海臨港AIDC正式運(yùn)營,推動 商湯的大裝置 持續(xù)升級。

今年3月底,商湯大裝置就已經(jīng)完成2.7萬塊GPU的部署并實(shí)現(xiàn)了5ExaFLOPS的算力輸出能力,可最多支持20個千億參數(shù)量大模型(以千卡并行)同時訓(xùn)練,最高可支持萬億參數(shù)超大模型的訓(xùn)練,而根據(jù)此次財報數(shù)據(jù),如今其上線GPU數(shù)量提升到約3萬塊,算力規(guī)模已提升20%至6ExaFLOPS。

基于大裝置的底層積累和充沛算力,商湯可以以更低成本和更高效地完成大模型從數(shù)據(jù)清洗、數(shù)據(jù)標(biāo)注到邏輯訓(xùn)練等一系列大模型“進(jìn)化”所需工作。

優(yōu)勢不僅在成本和速度,更在模型質(zhì)量和企業(yè)落地效果。盡管如今市面上大部分開源模型可以自由調(diào)用接口和模型能力,但其背后對應(yīng)的模型底層能力以及配套工具鏈相關(guān)能力并不完備,具體到產(chǎn)業(yè)場景側(cè)則是實(shí)際落地效果極差,甚至無法落地。

而商湯的開源模型具備足夠扎實(shí)的底層模型能力,這離不開其豐富的高質(zhì)量原始語料數(shù)據(jù)儲備。 據(jù)了解,如今商湯可以每月產(chǎn)出超過2萬億token的高質(zhì)量數(shù)據(jù),預(yù)計年底高質(zhì)量數(shù)據(jù)儲備將突破10萬億token。

值得一提的是,商湯一直以來都是開源的積極擁護(hù)者。在徐立看來,大模型開源能夠使行業(yè)和自身從更廣泛的合作創(chuàng)新中受益。大語言模型同樣通過擁抱開源,從生態(tài)中吸取力量。

比如近期商湯開源的InternLM-7B(70億參數(shù)),在多個模型測試榜單高踞榜首,成為性能最好的輕量級基模型。在部分榜單上,InternLM-7B甚至超過了參數(shù)量更大的130億參數(shù)的LLaMA2的模型。接下來InternLM-20B模型(200億參數(shù))也將迎來開源。據(jù)悉,InternLM-20B具備優(yōu)秀的工具調(diào)用能力,且運(yùn)行成本較低,適合構(gòu)建各類AI應(yīng)用。

而在開源之外,商湯同樣致力于打造具有競爭力且好用的“基座模型”,支持上萬個潛在行業(yè)大模型的需求。

這恰構(gòu)成了一個完善的閉環(huán)。可以理解為,基于開源、閉源的大模型服務(wù)模式,商湯在向外界展示強(qiáng)大底層模型的技術(shù)實(shí)力的同時,也更建立起新的飛輪,這個飛輪不僅是基于更大量級大模型使用頻次帶來的模型優(yōu)化,也更是從開源到閉源的“技術(shù)——商業(yè)”變現(xiàn)。

而這些,最終構(gòu)建出的恰是過去半年里商湯在大模型曲線上的不斷向上。

三、在新戰(zhàn)略里,重新理解商湯

在今年3月商湯科技發(fā)布的2022財報中,除了財務(wù)數(shù)字的披露外,另外一個值得關(guān)注的是商湯這家企業(yè)的公司愿景和戰(zhàn)略目標(biāo)的進(jìn)化。

這次改變的具體細(xì)節(jié)是,從之前“以人工智能實(shí)現(xiàn)物理世界和數(shù)字世界的連接,促進(jìn)社會生產(chǎn)力可持續(xù)發(fā)展,并為人們帶來更好的虛實(shí)結(jié)合生活體驗(yàn)”,轉(zhuǎn)型為“將通用人工智能(AGI)作為核心戰(zhàn)略目標(biāo),以期在未來幾年內(nèi)實(shí)現(xiàn)AGI技術(shù)的重大突破”。

在近期的財報電話會上,徐立將這一戰(zhàn)略進(jìn)一步細(xì)化?!跋掳肽辏覀儠柚S厚的數(shù)據(jù)和算力資源,來制作更強(qiáng)的基模型。通過開源和商業(yè)化的雙重推動,2024年,商湯的目標(biāo)是成為領(lǐng)先的生成式AI應(yīng)用生態(tài)平臺?!?/p>

徐立表示,希望給行業(yè)帶來更強(qiáng)的大模型能力,助力用戶在生成式AI的時代作出顛覆性的產(chǎn)品,來獲得成功。”

一個明顯的感知是,商湯對未來的戰(zhàn)略路徑已然更加清晰。

對于始終深耕AI的企業(yè),有人曾有一個形象的比喻,這波大模型驅(qū)動的新AI浪潮的來臨,恰像是一場球賽進(jìn)行到中場,一些站在球門附近的人,“突然”接到了球。

站在球門附近,這是對商湯們的最佳側(cè)寫。幾個數(shù)字是,在今年上半年,商湯基于AI的研發(fā)投入超過17.83億元,而在過去5年里,其累計研發(fā)投入更是超過140億。

這些資金背后對應(yīng)的是商湯對于AI路徑的絕對堅持和持續(xù)深耕。而在過去AI不具備強(qiáng)工程落地能力的幾年時間里,這種一直站在“門口”的動作往往不被外界理解。

但在如今的大模型時代,這些超過10年的積累和投入最終轉(zhuǎn)化成為商湯在AGI落地的絕對加速度,以及當(dāng)下愈發(fā)明確的前進(jìn)和自證路徑。

這種證明更來自社會層面。

根據(jù)弗若斯特沙利文發(fā)布的《AI大模型市場研究報告(2023)》顯示,商湯在產(chǎn)品技術(shù)、戰(zhàn)略愿景以及生態(tài)開放構(gòu)建等綜合競爭力位列國內(nèi)第一。此外,就在上周,商湯“商量SenseChat”正式成為首批獲批上線向社會開放的大模型產(chǎn)品。

可以說,商湯還是那個商湯,始終堅持在AGI領(lǐng)域持續(xù)研發(fā)和深耕。但在大模型AI形態(tài)的加持下,它更多的產(chǎn)品、更多的技術(shù),正在越來越多地落地到一眾產(chǎn)業(yè)場景,也更多地被市場和企業(yè)看見和接納。

 

本文來自投稿,不代表增長黑客立場,如若轉(zhuǎn)載,請注明出處:http://gptmaths.com/quan/104990.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
上一篇 2023-09-07 10:14
下一篇 2023-09-07 11:10

增長黑客Growthhk.cn薦讀更多>>

發(fā)表回復(fù)

登錄后才能評論