2024年7月5日,上海——2024世界人工智能大會(huì)暨人工智能全球治理高級(jí)別會(huì)議(WAIC 2024)戰(zhàn)略合作伙伴商湯科技召開“大愛無疆·向新力”人工智能論壇,發(fā)布國內(nèi)首個(gè)所見即所得模型“日日新5o”,交互體驗(yàn)對標(biāo)GPT-4o,實(shí)現(xiàn)全新AI交互模式。
通過整合跨模態(tài)信息,基于聲音、文本、圖像和視頻等多種形式,國內(nèi)首個(gè)所見即所得模型“日日新5o”帶來一種全新的AI交互模式,即實(shí)時(shí)的流式多模態(tài)交互?,F(xiàn)場也為大家展示了這種創(chuàng)新交互模式——
工作人員剛開始僅是和“日日新5o”打個(gè)招呼,它就自動(dòng)識(shí)別出工作人員脖子佩戴的胸卡帶子上的字眼,判斷出現(xiàn)場就是世界人工智能大會(huì)會(huì)場,并表示在這個(gè)地方可以“好好學(xué)習(xí)”。
接下來工作人員拿了一只可愛小狗玩偶,“日日新5o”準(zhǔn)確描述了小狗的外貌、表情以及重要穿戴——一個(gè)帶著印有商湯科技logo白帽子,很給主場人排面。
再上些難度,隨便翻開一本書的任何一頁,“日日新5o”都能自動(dòng)介紹,不是簡單的OCR識(shí)別文字,而是識(shí)別圖文給出好理解的總結(jié),這一切在瞬間即可完成,真正做到實(shí)時(shí)交互。
工作人員還現(xiàn)場發(fā)揮了“畫功”,隨手畫了一只簡筆畫小兔子,“日日新5o”直呼畫得可愛,而后工作人員又畫了一個(gè)微笑表情,它從這個(gè)平靜的表情中捕捉到了笑意,工作人員又改了一筆把嘴巴畫大增添了舌頭,“日日新5o”看到后立馬說道這表情開心多了。
能聽會(huì)看更會(huì)找話題,就如同真人聊天一般的交流對話,這種交互模式特別適用于實(shí)時(shí)對話和語音識(shí)別等應(yīng)用,其多任務(wù)適應(yīng)性強(qiáng),能夠在同一模型中自然處理多種任務(wù),且根據(jù)不同上下文自適應(yīng)調(diào)整行為和輸出,能夠?qū)崿F(xiàn)對標(biāo)GPT-4o的交互體驗(yàn)正是源于“日日新5.5”基礎(chǔ)模型能力的全面提升。
今年4月發(fā)布的“日日新5.0”是國內(nèi)首個(gè)對標(biāo)GPT-4 Turbo的國產(chǎn)大模型,短短兩個(gè)多月時(shí)間,全新“日日新5.5”體系迎來多項(xiàng)升級(jí),綜合性能較“日日新5.0”平均提升30%,在數(shù)學(xué)推理、英文能力和指令跟隨等能力明顯增強(qiáng),交互效果和多項(xiàng)核心指標(biāo)實(shí)現(xiàn)對標(biāo)GPT-4o。
“日日新5.5”采用混合端云協(xié)同專家架構(gòu),最大限度發(fā)揮云邊端協(xié)同,降低推理成本,模型訓(xùn)練基于超過10TB tokens高質(zhì)量訓(xùn)練數(shù)據(jù),包括大量合成的思維鏈數(shù)據(jù),提升推理思維能力。
為了讓更多企業(yè)用戶低門檻接入并使用“日日新”大模型體系的強(qiáng)大能力,商湯于近期推出了“大模型0元Go”計(jì)劃。凡是“日日新”的新注冊用戶,都可獲得涉及調(diào)用、遷徙、訓(xùn)練等多項(xiàng)免費(fèi)服務(wù)大禮包。同時(shí),商湯還將免費(fèi)贈(zèng)送5000萬Tokens包,并且派出專屬搬家顧問,幫助OpenAI用戶實(shí)現(xiàn)零服務(wù)成本遷移。
本文來自投稿,不代表增長黑客立場,如若轉(zhuǎn)載,請注明出處:http://gptmaths.com/cgo/model/120573.html