在這些回答背后共同折射出的一個現(xiàn)實(shí)是——大模型不再是一個單選題,而更是一個綜合題。在這個新的時代帆船上,產(chǎn)品、服務(wù)、安全、開放等全部都需要成為必需品,甚至是從企業(yè)的落地層面來看,這些更是剛需品。
作者| 皮爺
出品|產(chǎn)業(yè)家
過去的5個月,李亮很忙。
“從今年3月份文心一言發(fā)布之后,很多工業(yè)側(cè)的企業(yè),甚至是國央企,都主動來和我們探討大模型的落地?!彼硎?,“也包括很多行業(yè)伙伴都找過來,說看如何一起打造具備服務(wù)共性的平臺?!?/p>
作為百度智能云的一位工程師,過去的近半年時間里,他真切感受到了企業(yè)對AI大模型的熱切程度。這種熱切是企業(yè)對具備落地能力的新技術(shù)的期待,也更是擔(dān)心落后的焦慮。
這不是個例。
伴隨著OpenAI和國內(nèi)一眾大模型企業(yè)的頻頻發(fā)聲,越來越多的“產(chǎn)業(yè)+AI大模型”框架正在清晰地呈現(xiàn)在企業(yè)面前,相較于之前的元宇宙、區(qū)塊鏈等技術(shù),AI大模型應(yīng)用距離企業(yè)的真實(shí)場景更近,應(yīng)用路徑也更短,效果更“立竿見影”。
但在熱火朝天的AI實(shí)踐里,越來越多企業(yè)開始逐漸發(fā)現(xiàn)一個更為現(xiàn)實(shí)的問題:最佳的大模型切入點(diǎn)在哪?或者說,企業(yè)應(yīng)該如何高效地構(gòu)建適配自身的大模型?
問題背后,對應(yīng)著一眾企業(yè)在大模型轉(zhuǎn)型路上的“挫折”?!艾F(xiàn)在很多企業(yè)的問題是有意愿,但沒渠道;或者是嘗試后,整體進(jìn)度很慢。”一位投資人告訴我們,“中間包括數(shù)據(jù)清洗、標(biāo)注,以及prompt的生成、模型微調(diào)、訓(xùn)練這些,市面上都沒有特別易用的方式?!?/p>
實(shí)際上,這些現(xiàn)象也構(gòu)成了盡管企業(yè)對大模型熱情依舊高漲,但越來越多開始在邁出第一步同時保持“謹(jǐn)慎”態(tài)度,這種觀望在清晰與否的轉(zhuǎn)型路徑,也更在參與其中的成本性價(jià)比。
不過,AI加速的好消息依舊在傳來。在剛剛過去的8月31日,百度文心一言、商湯商量SenseChat等大模型首批通過了《生成式人工智能服務(wù)管理暫行辦法》備案,正式面向全社會開放服務(wù)。此外,據(jù)悉,針對企業(yè)用戶,百度智能云還將在9月5日舉行的2023百度云智大會上宣布四大配套舉措,旨在助力企業(yè)以更低成本更快捷方式使用上大模型。
在滾滾而來的AI洪流中,企業(yè)應(yīng)該如何選擇適合自己的大模型?或者說,在如今大模型開放的AI時代,怎樣的AI大模型才能成為企業(yè)在AI數(shù)智化時代的最佳航船?
在8家大模型獲批上線的當(dāng)下,這個問題正在被加速推到臺前。
一、AI需求,和背后的新產(chǎn)業(yè)命題
在得出答案之前,不妨先來看天平的另一側(cè):即客戶AI落地的難點(diǎn)到底在哪?
“現(xiàn)在大家對于大模型在行業(yè)會怎么落地,有哪些完全顛覆性的應(yīng)用,或者說這種能帶來很大風(fēng)潮的應(yīng)用,會出現(xiàn)在哪兒,也都不是很確定。其實(shí)我們客戶也很清楚的認(rèn)識到這一點(diǎn)?!卑俣戎悄茉埔晃唤鉀Q方案工程師表示。
這是如今國內(nèi)很多企業(yè)面臨AI大模型的共性。即盡管企業(yè)對自身的業(yè)務(wù)場景有充分的認(rèn)知,但大模型能做到哪一步,以及如何使用大模型進(jìn)行原有業(yè)務(wù)的降本增效,這都是未知命題。
而對部分已經(jīng)嘗試的企業(yè),問題則是更為尖銳。
“我們最開始使用的是國外開源模型,但最近也在考慮嘗試重新接入國內(nèi)的大模型,因?yàn)閲忾_源的中文語義理解太差了,基本的交互都出現(xiàn)問題。”一位低代碼企業(yè)創(chuàng)始人這樣告訴我們。
有同樣感受的是另外一家農(nóng)業(yè)方向的企業(yè),在和其創(chuàng)始人的交流過程中,他直言,“從最開始做prompt,到后面一輪一輪的訓(xùn)練,包括數(shù)據(jù)清洗、高質(zhì)量標(biāo)注等等,整個過程的開銷非常大的,訓(xùn)練效果還不是特別好,甚至不如原有界面?!苯刂沟侥壳?,這家企業(yè)的大模型產(chǎn)品仍然處在內(nèi)測階段,尚未對外使用。
在這些之外,更多的企業(yè)則是停滯在大模型的“第一步”——選型。
不過,在選型階段,企業(yè)的顧慮有所不同。對目前大部分中小企業(yè)而言,其選型難的原因在于不清楚哪家底層大模型企業(yè)的產(chǎn)業(yè)能力強(qiáng),這些能力包括產(chǎn)品能力,也更有對模型微調(diào)、知識增強(qiáng)等服務(wù)落地的要求。
而對大型企業(yè)而言,除了數(shù)據(jù)安全之外,產(chǎn)業(yè)理解和復(fù)用性是企業(yè)的最核心考量。“大企業(yè)更看重的是,你不僅要在我看重的這一點(diǎn)的業(yè)務(wù)上能做出效果,還有就是要在整個集團(tuán)的復(fù)用性上,能和既有業(yè)務(wù)結(jié)合的效率要更高?!鄙鲜龉こ處煴硎?。
在他的感知里,以央國企為代表的大型企業(yè)更多地希望大模型服務(wù)商是一個教練的角色,不僅要給到好的工具,還要教會企業(yè)怎么用,從長期提升價(jià)值。
從更大的視角來看,當(dāng)下大模型落地的難點(diǎn)大概分為三個層面,一是企業(yè)不知道選擇怎樣的大模型,或者說企業(yè)不知道自身的需求怎樣的大模型可以滿足,視野范圍內(nèi)的大模型選項(xiàng)太少;二是對部分選擇自建大模型的企業(yè)而言,其在prompt提示詞和數(shù)據(jù)清洗、標(biāo)注以及中文增強(qiáng)等工具鏈層面屢屢碰壁,投入太大或者經(jīng)驗(yàn)不足;三是企業(yè)自身的數(shù)據(jù)安全和合規(guī)性較高,同時需要較深的產(chǎn)業(yè)know-how,對大模型服務(wù)商的功能能力要求較高。
不難感知到的是,如果從原子化服務(wù)的角度拆解來看,當(dāng)下國內(nèi)企業(yè)對大模型的需求已然不僅在產(chǎn)品層面,如參數(shù)、邏輯推理等硬核指標(biāo),更大的需求點(diǎn)涌現(xiàn)在服務(wù)側(cè),即對不同企業(yè)需求的一站式滿足,這些滿足或是在prompt層面、或在中文增強(qiáng)、數(shù)據(jù)標(biāo)注、訓(xùn)練層面,再或是在產(chǎn)業(yè)場景適配乃至數(shù)據(jù)安全,以及最核心的成本層面。
大模型,已然從一道單純的技術(shù)命題,悄然進(jìn)化為一道糅合技術(shù)、產(chǎn)品、服務(wù)等全部環(huán)節(jié)的產(chǎn)業(yè)綜合命題。
二、千帆背后,看見大模型的“真實(shí)表達(dá)”
在忙碌的幾個月里,李亮對一家企業(yè)印象很深刻。
“有一個礦山行業(yè)的合作伙伴,在大模型的領(lǐng)域非常期望跟我們合作,想要通過大模型去進(jìn)行整個的礦山的智慧化服務(wù),包括安全生產(chǎn)的管理,安全生產(chǎn)的預(yù)警等等?!彼f道,“我們現(xiàn)在在跟他進(jìn)行多輪測試,有很多也有非常不錯的測試效果?!?/p>
他的意外之處在于,像礦山這樣的偏傳統(tǒng)的企業(yè),也開始主動找到百度尋求大模型方面的進(jìn)展和落地。據(jù)了解,如今雙方經(jīng)過多輪共創(chuàng),一個基于礦山場景的大模型已經(jīng)接近成型。
實(shí)際上,這不是第一個主動找到百度智能云的企業(yè)。而百度智能云對這些產(chǎn)業(yè)伙伴的一個統(tǒng)一服務(wù)界面,正是在今年3月份正式推出的一站式企業(yè)級大模型平臺“百度智能云千帆”。
作為唯一TO B大模型界面,百度智能云千帆也恰構(gòu)成著百度大模型在如能源、金融、政務(wù)、交通等不同產(chǎn)業(yè)場景的真實(shí)表達(dá),以及包括數(shù)據(jù)管理、模型訓(xùn)練、評估&優(yōu)化、預(yù)測服務(wù)和Prompt工程和插件服務(wù)等全部大模型開發(fā)周期的能力展示。
而在剛剛過去的8月,它更是交出了一張亮眼的成績單。
一個亮眼之處是,在本次對外公布的模型種類中,百度智能云千帆除了文心大模型的核心外,其也更全面接入Llama 2全系列、ChatGLM2-6B、RWKV-4-World、MPT-7B-Instruct、Falcon-7B等33個開源大模型,成為國內(nèi)擁有大模型最多的平臺。
換言之,基于百度智能云千帆的“模型倉庫”,除了文心大模型之外,企業(yè)可以自行適合自身的其它基礎(chǔ)大模型產(chǎn)品。
此外,和其它模型倉庫不同的是,百度智能云千帆對“模型倉庫”內(nèi)的模型進(jìn)行了“二次加工”。
比如,在安全性層面,千帆對所有接入的第三方模型均做了模型安全增強(qiáng),不僅保障文心大模型的內(nèi)容安全,還保障了第三方大模型的安全輸出;再比如在成本層面,對每一個接入的大模型,千帆都做了二次性能增強(qiáng)。
根據(jù)測算,在性能調(diào)優(yōu)后,第三方模型體積可壓縮至25%-50%,推理成本可降低50%。這意味著,相較于直接調(diào)用,企業(yè)在千帆平臺上使用這些模型可極大地節(jié)約成本,提升效果。
與此同時,千帆對接入的大模型做了深度適配,其為企業(yè)提供模型再訓(xùn)練的全套工具鏈以及多種形式模型調(diào)優(yōu),其中包括SFT(全量參數(shù)微調(diào)、Prompt Tuning、Lora)及強(qiáng)化學(xué)習(xí)(獎勵模型學(xué)習(xí)、強(qiáng)化學(xué)習(xí)訓(xùn)練)等等。
換言之,基于百度智能云千帆,不論是選擇文心大模型,還是平臺上的第三方開源大模型,企業(yè)都可以端到端地搭建自身的專屬模型。
不僅于此,在對外的服務(wù)能力上,百度智能云千帆可以為企業(yè)提供公有云和私有部署兩種方式,包括上文所說的大模型落地難的推理、微調(diào)、托管,企業(yè)都可以基于公有云模式接入使用。而在本地部署方面,百度智能云千帆也更是可以純軟件和軟硬一體的交付方式,充分滿足企業(yè)本地部署的要求。
實(shí)際上,這些能力在也構(gòu)成了百度智能云千帆在一眾產(chǎn)業(yè)側(cè)的真實(shí)落地。根據(jù)不完全統(tǒng)計(jì),在過去的5個月時間里,千帆大模型平臺在超過400個真實(shí)產(chǎn)業(yè)場景中實(shí)現(xiàn)了落地。截止目前,百度文心大模型已擁有中國最大的產(chǎn)業(yè)落地規(guī)模。
這些落地構(gòu)成了中國大模型賽道的一個個特殊節(jié)點(diǎn)。比如在能源層面,百度智能云和國家電網(wǎng)聯(lián)合打造的“設(shè)備運(yùn)檢知識助手”入選北京市首批十大行業(yè)大模型應(yīng)用案例。與深圳燃?xì)饴?lián)合發(fā)布的“深燃-百度·文心大模型”,基于大模型能力,只需要進(jìn)行微調(diào),就可以形成針對性的行業(yè)模型能力,完成多個應(yīng)用場景的任務(wù)。
再比如在金融層面,百度智能云與中信金控聯(lián)合打造了基于大模型的數(shù)字人,讓每一位銀行客戶都有自己專屬的理財(cái)顧問,可以承擔(dān)包括投研助手、投顧助手、營銷助手、合規(guī)助手等在內(nèi)的多個角色。
這些真實(shí)的產(chǎn)業(yè)落地側(cè)寫也更在一眾中小企業(yè)側(cè)。根據(jù)不完全統(tǒng)計(jì),已經(jīng)有超過10萬家企業(yè)申請測試,這個數(shù)目伴隨著如今面向全社會層面的開放動作,也更在加速倍增。據(jù)了解,在在開放的24小時內(nèi),文心一言共計(jì)回復(fù)網(wǎng)友問題數(shù)超過3342萬個。
可以說,不論是在產(chǎn)品層面,還是服務(wù)層面,千帆大模型為企業(yè)提供的是一個開放兼容的大模型選擇界面,在這里,企業(yè)既可以實(shí)現(xiàn)從0到1的端到端大模型搭建,也更可以尋求到包括數(shù)據(jù)標(biāo)注、prompt在內(nèi)的一眾工具鏈能力,以最低的成本和門檻,構(gòu)建出自身的專屬大模型。
三、AI時代,我們需要怎樣的大模型?
如今,越來越多人開始討論的一個命題是:在如今的產(chǎn)業(yè)數(shù)字化時代,我們需要怎樣的大模型?有的人的回答是產(chǎn)品,有的人的回答是服務(wù),也更有人的回答是數(shù)據(jù)安全。
在這些回答背后共同折射出的一個現(xiàn)實(shí)是——大模型不再是一個單選題,而更是一個綜合題。在這個新的時代帆船上,產(chǎn)品、服務(wù)、安全、開放等全部都需要成為必需品,甚至是從企業(yè)的落地層面來看,這些更是剛需品。
不過,這些問題也正在被作答。
以百度智能云為例,除了在產(chǎn)業(yè)領(lǐng)域側(cè)聯(lián)合企業(yè)進(jìn)行落地之外,其也更是和生態(tài)伙伴聯(lián)合打造了更多基于特定場景的產(chǎn)品。比如和軟通動力打造的大模型基礎(chǔ)設(shè)施軟通天璇2.0,與微盟聯(lián)合構(gòu)建的AI應(yīng)用型產(chǎn)品WAI,以及和金蝶、金山辦公一起研發(fā)的專屬領(lǐng)域大模型產(chǎn)品。
在這個新的團(tuán)戰(zhàn)背后,大模型正在以更加真實(shí)的姿態(tài)出現(xiàn)在各個產(chǎn)業(yè)場景和各個企業(yè)應(yīng)用中,不僅是金融、能源,也不僅是大型的央國企,在如今百度智能云千帆的底座之上,越來越多的產(chǎn)業(yè)場景和越來越多體量的企業(yè)都正在齊力邁出AI大模型時代的第一步。
此外,從更大的視角也同樣能清晰看到的是,這些產(chǎn)業(yè)的真實(shí)表達(dá)也恰在構(gòu)成著大模型企業(yè)的產(chǎn)品和營收新增長飛輪。
根據(jù)不完全統(tǒng)計(jì),截至目前,百度智能云千帆平臺上有103款Prompt模板,包含對話、編程、電商、醫(yī)療、游戲、翻譯、演講等十余個場景。其中既有基于百度智能云在產(chǎn)業(yè)實(shí)踐中積累的Prompt模板,也有來源于文心一言高頻用戶的Prompt模板??梢灶A(yù)見的是,作為大模型訓(xùn)練中最核心的環(huán)節(jié)之一,這些Prompt模板將使得千帆更容易被企業(yè)和市場歡迎。
而在財(cái)報(bào)層面,根據(jù)百度發(fā)布的2023年Q2財(cái)報(bào)顯示,第二季度百度營收341億元實(shí)現(xiàn)加速增長,凈利潤高速增長44%。此外,由《IDC中國AI公有云服務(wù)市場份額,2022》報(bào)告數(shù)據(jù)顯示,2022年中國AI公有云服務(wù)總體市場79.7億元,其中百度智能云占28.9%排名第一。
或者可以說,在AI大模型在成為各個產(chǎn)業(yè)基建企業(yè)驗(yàn)金石的同時,它也更在成為一個新的發(fā)動機(jī)。
進(jìn)度仍在持續(xù)推進(jìn)。在接下來的9月5日,百度智能云還將在2023百度云智大會上宣布四大配套舉措。
據(jù)內(nèi)部人士透露,在此次大會上,百度智能云將全面升級“千帆大模型平臺”,升級將覆蓋算力基礎(chǔ)設(shè)施、大模型工具鏈、高質(zhì)量數(shù)據(jù)集等等。此外,其將推出基于文心大模型重構(gòu)的行業(yè)解決方案,同時還將發(fā)布覆蓋服務(wù)營銷、辦公提效、生產(chǎn)優(yōu)化三大領(lǐng)域的10款企業(yè)級的AI原生應(yīng)用產(chǎn)品。大模型相關(guān)的生態(tài)政策也將在大會上同步披露。
或許再來回答前面那個問題,即“我們需要怎樣的一個大模型?”——這不僅是一個對企業(yè)而言,尋找最佳選項(xiàng)的命題,也更是對大模型企業(yè)而言,錨定未來和自證的長期思考。
恰如百度相關(guān)負(fù)責(zé)人在采訪中所說,“未來肯定還會有更多AI產(chǎn)品,或許這些產(chǎn)品不是百度開發(fā)出來,但企業(yè)都可以基于百度智能云千帆開發(fā)出來,這是我們想要的,也是會一直持續(xù)去做的。”
答案,已經(jīng)在成形的路上。
*文中李亮為化名
本文來自投稿,不代表增長黑客立場,如若轉(zhuǎn)載,請注明出處:http://gptmaths.com/quan/104680.html