2024年4月23日,上?!?/strong>商湯科技SenseTime舉辦技術(shù)交流日活動,發(fā)布行業(yè)首個“云、端、邊”全棧大模型產(chǎn)品矩陣,以滿足不同規(guī)模場景的應(yīng)用需求,并且全新升級“日日新SenseNova 5.0”大模型體系,其綜合能力全面對標GPT-4?Turbo,技術(shù)領(lǐng)跑加速生成式AI向產(chǎn)業(yè)落地的全面躍遷,實現(xiàn)大模型按需所取。
在人工智能發(fā)展的最基本法則——尺度定律(Scaling Law)的準則下,商湯持續(xù)尋求最有數(shù)據(jù)配比并建立數(shù)據(jù)質(zhì)量評價體系,推動自身大模型研發(fā)的同時,也為行業(yè)伙伴提供大模型訓(xùn)練、微調(diào)、部署和各類生成式AI的能力及服務(wù)。
商湯科技董事長兼CEO徐立表示:“商湯在尺度定律的指導(dǎo)下,會持續(xù)探索大模型能力的KRE三層架構(gòu)(知識-推理-執(zhí)行),不斷突破大模型能力邊界。”
“日日新SenseNova5.0”性能超越GPT-4 Turbo:文理雙修能力大幅提升,新增多模態(tài)交互
自去年4月首次發(fā)布,商湯“日日新SenseNova”大模型體系已正式推出五個大版本迭代?;诔^10TB?tokens訓(xùn)練、覆蓋大量合成數(shù)據(jù),全新的“日日新SenseNova 5.0”(以下簡稱:日日新5.0)采用混合專家架構(gòu),推理時上下文窗口可以有效到?200K?左右。
本次更新主要聚集增強了知識、數(shù)學(xué)、推理及代碼能力,全面對標?GPT-4 Turbo,主流客觀評測上達到或超越?GPT-4 Turbo。
在文科能力方面,“日日新5.0”的創(chuàng)意寫作能力、推理能力以及總結(jié)能力均大幅提升,相同的中文知識注入后,可以獲得更好的理解總結(jié)及問答,為教育、內(nèi)容產(chǎn)業(yè)等垂直應(yīng)用場景提供有力輔助。
“日日新5.0”和GPT-4回答趣味推理問題:“媽媽給圓圓沖了一杯咖啡,圓圓喝了半杯后,將它加滿水,然后她又喝了半杯后,再加滿水,最后全部喝完。問圓圓喝的咖啡多,還是水多?”,“日日新5.0”回答正確。
在理科能力方面,“日日新5.0”數(shù)理能力、代碼能力及推理能力達到業(yè)內(nèi)領(lǐng)先水平,為金融、數(shù)據(jù)分析等場景落地提供堅實基礎(chǔ)。
本次“日日新5.0”另一大核心指標就是多模態(tài)能力,商湯多模態(tài)大模型的圖文感知能力達到全球領(lǐng)先水平,在多模態(tài)大模型權(quán)威綜合基準測試MMBench中綜合得分排名首位,在多個知名多模態(tài)榜單MathVista,AI2D,ChartQA,TextVQA,DocVQA,MMMU 取得領(lǐng)先成績。
“日日新SenseNova5.0”在應(yīng)用產(chǎn)品層面也實現(xiàn)了更卓越的多模態(tài)能力,支持高清長圖的解析和理解以及文生圖交互式生成,還可以實現(xiàn)復(fù)雜的跨文檔知識抽取及總結(jié)問答展示,還具備豐富的多模態(tài)交互能力。
率先完成“云端邊”全棧布局:端側(cè)模型位列行業(yè)首位,邊側(cè)推出企業(yè)級應(yīng)用一體機
前瞻洞察中心化算力需求向端側(cè)擴展的未來趨勢及企業(yè)級在邊緣側(cè)的AI需求,商湯科技領(lǐng)先業(yè)內(nèi)首次推出“云、端、邊”全棧大模型產(chǎn)品矩陣,其中包括應(yīng)用于終端設(shè)備的“商湯端側(cè)大模型”,以及面向金融、代碼、醫(yī)療、政務(wù)等多個領(lǐng)域的邊緣產(chǎn)品“商湯企業(yè)級大模型一體機”。
今年是端側(cè)大模型應(yīng)用的元年,為了滿足移動終端用戶對大模型技術(shù)的應(yīng)用需求,商湯推出日日新·端側(cè)大模型,性能實現(xiàn)同等尺度性能最優(yōu),跨級尺度全面領(lǐng)先。
商湯還推出端云協(xié)同解決方案,可以通過智能化判斷協(xié)同發(fā)揮端云各自優(yōu)勢,需要聯(lián)網(wǎng)搜索或處理復(fù)雜場景時分流至云端處理,部分場景端側(cè)處理占比超過80%,從而顯著降低推理成本。
商湯日日新·端側(cè)大語言模型的推理速度達到了業(yè)內(nèi)最快,可在中端平臺實現(xiàn)18.3字/s的平均生成速度,旗艦平臺更是達到了78.3字/s。
擴散模型同樣可在端側(cè)?實現(xiàn)業(yè)內(nèi)最快的推理速度,端側(cè)LDM-AI擴圖技術(shù)在某主流平臺上,推理速度小于1.5秒,比友商云端app快10倍,支持輸出1200萬像素及以上的高清圖片,支持在端上快速進行等比擴圖、自由擴圖、旋轉(zhuǎn)擴圖等圖像編輯功能。
從今日起,商湯端側(cè)業(yè)務(wù)SDK正式發(fā)布,也歡迎集成體驗。
對于金融、代碼、醫(yī)療、政務(wù)等重點行業(yè)邊緣側(cè)日益增長的AI應(yīng)用需求,商湯正式推出企業(yè)級大模型一體機,可同時支持企業(yè)級千億模型加速和知識檢索硬件加速,實現(xiàn)本地化部署,即買即用,降低企業(yè)應(yīng)用大模型的門檻。相比行業(yè)同類產(chǎn)品,推理成本節(jié)約80%,檢索大大加速,CPU工作負載50%。
聯(lián)合生態(tài)伙伴創(chuàng)新AI 2.0時代產(chǎn)品應(yīng)用,打造新質(zhì)生產(chǎn)力
本次活動現(xiàn)場,商湯還邀請到金山辦公、海通證券、小米、閱文集團、華為等多位生態(tài)伙伴嘉賓,共同探討和交流大模型技術(shù)在辦公、金融、出行等不同領(lǐng)域的應(yīng)用及前景。
自2023年起,商湯與金山辦公達成深度合作,基于“日日新”大模型的卓越代碼生成及工具調(diào)用能力,助力WPS?365打造更高效釋放場景能力的辦公新質(zhì)生產(chǎn)力平臺,為企業(yè)構(gòu)建專屬的“企業(yè)大腦”。金山辦公CEO章慶元表示:“在辦公應(yīng)用場景內(nèi),商湯大模型的表現(xiàn)十分出色,能夠幫助我們的用戶解決辦公中的復(fù)雜問題,提升效率?!?/p>
在金融領(lǐng)域,海通證券與商湯科技聯(lián)合發(fā)布金融行業(yè)多模態(tài)全棧式大模型,雙方在智能客服、合規(guī)風控、代碼輔助、展業(yè)辦公助手等領(lǐng)域助推業(yè)務(wù)落地,并共研智能投顧、輿情監(jiān)控等行業(yè)前沿場景,打通證券行業(yè)大模型落地的全棧式能力。海通證券副總經(jīng)理兼首席信息官?毛宇星談到:“通過與商湯合作,我們利用大模型技術(shù)實現(xiàn)了海通證券數(shù)智化轉(zhuǎn)型,未來,我們將結(jié)合全棧式AI能力進行業(yè)務(wù)流程、交互變革與數(shù)智化業(yè)務(wù)系統(tǒng)重構(gòu)?!?/p>
在個人出行場景,近期火爆市場的小米汽車SU7的智能車艙中就應(yīng)用了商湯的大模型技術(shù),基于商湯端云大模型解決方案,小米小愛同學(xué)為車主提供智能化交互體驗。小米集團小愛總經(jīng)理王剛在與商湯科技聯(lián)合創(chuàng)始人、首席科學(xué)家王曉剛對話時表示:“商湯的云邊端全棧組合,可以很好地賦能和適配小米物聯(lián)網(wǎng)生態(tài)。我們希望與商湯共同為我們的用戶打造更具智能化的產(chǎn)品體驗。”
左為小米集團小愛總經(jīng)理 王剛,右為商湯科技聯(lián)合創(chuàng)始人、首席科學(xué)家 王曉剛
此外,今天商湯還發(fā)布了基于昇騰原生的行業(yè)大模型,共同打造面向金融、醫(yī)療、政務(wù)、代碼等大模型產(chǎn)業(yè)生態(tài)。
在自身應(yīng)用方面,商湯“日日新SenseNova 5.0”在秒畫、如影、格物、瓊宇、大醫(yī)、小浣熊家族等產(chǎn)品均有重要更新。
“文生視頻”已在路上,商湯科技堅定邁向AGI時代
在本次技術(shù)交流日最后環(huán)節(jié),商湯科技董事長兼CEO徐立還帶來了三段完全由大模型生成的視頻,并強調(diào)文生視頻平臺對于人物、動作和場景的可控性。
商湯科技在文生視頻平臺方面也取得了技術(shù)突破,未來,通過輸入一段文字或一個完整的描述,就可以生成一段視頻,而且人物的服飾、發(fā)型、場景都可以根據(jù)預(yù)先設(shè)定,保持視頻內(nèi)容的連貫性和一致性。
通過商湯打造的智能算力中心,可以不斷賦能于大模型的訓(xùn)練,目前,日日新大模型體系在自然語言處理、視頻生成和深度學(xué)習(xí)優(yōu)化等多個方面取得創(chuàng)新。
一方面,現(xiàn)階段大模型發(fā)展已進入落地階段,如何與產(chǎn)業(yè)、應(yīng)用場景結(jié)合是關(guān)鍵一環(huán);另一方面,“尺度定律”路徑逐漸清晰,“涌現(xiàn)”時刻不定出現(xiàn),前瞻探索最先進的大模型技術(shù)也是重中之重。
秉承創(chuàng)立之初“堅持原創(chuàng),讓AI引領(lǐng)人類進步”的目標和愿景,商湯科技的大模型技術(shù)和產(chǎn)品已在醫(yī)療、教育、法律、工業(yè)等各行各業(yè)進行實踐應(yīng)用。如大模型以“日日新”為名,商湯一直堅定朝向通用人工智能的目標前行,突破數(shù)據(jù)與算力的限制,引領(lǐng)大模型的創(chuàng)新與落地。
本文來自投稿,不代表增長黑客立場,如若轉(zhuǎn)載,請注明出處:http://gptmaths.com/cgo/market/116705.html