正是長期堅(jiān)定AI賽道,堅(jiān)定布局、踏實(shí)前進(jìn)、長期主義,讓科大訊飛可以快速打造出技術(shù)實(shí)力領(lǐng)先的國產(chǎn)大模型,也讓科大訊飛最有希望在中國率先實(shí)現(xiàn)智慧涌現(xiàn)。
作者/文林
出品/新摘商業(yè)評論
自去年11月底,OpenAI公司發(fā)布ChatGPT之后,短短兩個月的時(shí)間里,全球活躍用戶數(shù)超過一個億。
通過對海量數(shù)據(jù)的高質(zhì)量清洗和對上億參數(shù)大模型的學(xué)習(xí)與訓(xùn)練,ChatGPT實(shí)現(xiàn)了在文本生成、語言理解、基于思維鏈的邏輯推理以及數(shù)學(xué)能力、代碼能力等多個領(lǐng)域的智慧涌現(xiàn),并表現(xiàn)出極強(qiáng)的進(jìn)化能力:今年2月ChatGPT發(fā)布了全新的版本升級,3月15日又推出了GPT-4。
可以說,ChatGPT的橫空出世不僅刷新了普羅大眾對人工智能的認(rèn)知,也讓認(rèn)知大模型技術(shù)在全球引起了新的浪潮。
“傳統(tǒng)意義上通過堆時(shí)長、堆人力的商業(yè)模式將被根本性地顛覆,因此有人說,這一次人工智能在歷史上的意義不亞于PC和互聯(lián)網(wǎng)的誕生,我覺得這是完全恰當(dāng)?shù)囊环N表述?!笨拼笥嶏w董事長劉慶峰說道。
在5月6日科大訊飛舉行的訊飛“星火”認(rèn)知大模型成果發(fā)布會上,科大訊飛董事長劉慶峰、科大訊飛研究院院長劉聰正式發(fā)布訊飛“星火”認(rèn)知大模型,并帶來了豐富的應(yīng)用成果。自此,中國生成式AI市場再添一位猛將,大廠比拼AI大 模型,而科大訊飛為何能夠先行一步。
一、十年積累,智能技術(shù)攻關(guān)與儲備
1999年,中文語音市場由國際巨頭把持,還在中國科學(xué)技術(shù)大學(xué)就讀的劉慶峰懷揣著“中文語音技術(shù)必須由中國人做到全球最好,中文語音產(chǎn)業(yè)必須掌握在自己手上”的信念,毅然創(chuàng)立了科大訊飛。
10 年后, [孫秉辰1] ?連續(xù)在國際語種識別評測大賽中名列前茅的科大訊飛,在深圳證券交易所掛牌上 市,成為中國在校大學(xué)生創(chuàng)業(yè)的第一家上市公司。
在語音技術(shù)與產(chǎn)業(yè)確立了領(lǐng)導(dǎo)地位之后,隨著人工智能時(shí)代的來臨,科大訊飛又迎來了一個新的發(fā)展拐點(diǎn)。
“科大訊飛是中國的國家隊(duì),在2014年我們就推出了‘訊飛超腦計(jì)劃’,明確提出要讓機(jī)器像人一樣具備能理解會思考的能力。”劉慶峰在發(fā)布會上說道。
彼時(shí),人工智能的突破與認(rèn)知智能緊密相關(guān),而認(rèn)知智能的關(guān)鍵是讓機(jī)器能理解會思考,這必須要突破語言理解、知識表示、聯(lián)想推理,自主學(xué)習(xí)等多個方面。
為更好地探索和實(shí)踐認(rèn)知智能,美國、歐盟等發(fā)達(dá)國家分別提出了“Brain Initiative”和“Human Brain Project”等人腦研究計(jì)劃,投入巨資并將其提升到與“人類基因圖譜”重大工程并重的高度。蘋果、谷歌等國際IT產(chǎn)業(yè)巨頭也相繼推出了Siri、Google Now語音搜索等一系列人工智能應(yīng)用。
正是在這樣的背景下,訊飛發(fā)布訊飛語音云3.0、靈犀3.0,正式啟動“訊飛超腦計(jì)劃”,進(jìn)行認(rèn)知智能技術(shù)攻關(guān)和儲備,核心就是讓機(jī)器從“能聽會說”到“能理解會思考”。
自此之后,科大訊飛一路“飛奔”:2015年,發(fā)布了對人工智能產(chǎn)業(yè)具有里程碑意義的人機(jī)交互界面——AIUI;2017年,承建認(rèn)知智能國家重點(diǎn)實(shí)驗(yàn)室;2022年,發(fā)布“訊飛超腦2030計(jì)劃”,要讓人工智能“懂知識、善學(xué)習(xí)、能進(jìn)化” ,讓機(jī)器人走進(jìn)每一個家庭。
“在國家平臺和訊飛超腦計(jì)劃的支撐下,過去幾年我們在認(rèn)知智能領(lǐng)域取得了一系列全球領(lǐng)先的成果?!?/p>
僅2022年一年,科大訊飛就在人工智能關(guān)鍵核心技術(shù)領(lǐng)域累計(jì)摘取16項(xiàng)國際人工智能大賽的冠軍。其中13項(xiàng)涉及常識閱讀理解挑戰(zhàn)賽OpenBookQA、QASC、ReClor等專業(yè)領(lǐng)域知名競賽。
例 如,依托科大訊飛建設(shè)的認(rèn)知智能國家重點(diǎn)實(shí)驗(yàn)室的相關(guān)團(tuán)隊(duì):
在常識推理挑戰(zhàn)賽CommonsenseQA 2.0中刷新機(jī)器常識推理水平世界紀(jì)錄;
在科學(xué)常識推理挑戰(zhàn)賽OpenBookQA中以準(zhǔn)確率94.2%的絕對優(yōu)勢奪冠;
在常識推理挑戰(zhàn)賽QASC中以多模型準(zhǔn)確率93.48%、單模型準(zhǔn)確率92.07%奪冠,后兩項(xiàng)比賽更是超越人類平均水平。
(QASC挑戰(zhàn)賽最新榜單)
可以說,科大訊飛的“訊飛超腦計(jì)劃”,既是實(shí)現(xiàn)包括感知智能和認(rèn)知智能在內(nèi)的全面突破,也是其在人工智能領(lǐng)域的核心布局內(nèi)容。
目前,科大訊飛在教育、辦公、醫(yī)療等多個領(lǐng)域都有專有認(rèn)知模型。以醫(yī)療領(lǐng)域?yàn)槔?,作為國?nèi)唯一通過國家執(zhí)業(yè)醫(yī)師資格考試的AI系統(tǒng),測試成績超過96.3%的醫(yī)學(xué)考生,科大訊飛已累計(jì)為基層醫(yī)生提供超過5.8億次、日均超70多萬人次的AI輔診。積累了剛需行業(yè)數(shù)據(jù)之后,專有模型反哺通用大模型的發(fā) 展,將更快促進(jìn)其智慧涌現(xiàn)。
據(jù)劉慶峰透露,在2022年12月15日,科大訊飛 正式啟動“1+N”認(rèn)知智能大模型的專項(xiàng)攻關(guān)。其中,“1”為通用的認(rèn)知智能的大模型,“N”是把大模型在各個領(lǐng)域的落地,包括教育、辦公、汽車、人機(jī)交互以及醫(yī)療等眾多領(lǐng)域。這也是科大訊飛此次發(fā)布通用模型和行業(yè)產(chǎn)品的一個非常重要的試點(diǎn)。
二、堅(jiān)定AI賽道,鑄就大模型七大核心能力
如果說多年來對人工智能核心技術(shù)的不斷積累、突破,以及對未來發(fā)展方向的準(zhǔn)確預(yù)測,讓科大訊飛獲得了進(jìn)入大模型時(shí)代的“入場券”,那么海量的文本、代碼和知識數(shù)據(jù),則為科大訊飛能夠快速打造出行業(yè)引領(lǐng)的AI大模型提供了強(qiáng)有力的支撐。
作為國內(nèi)領(lǐng)先的人工智能企業(yè),科大訊飛不但擁有豐富的技術(shù)積累和經(jīng)驗(yàn),還建設(shè)了目前業(yè)界一流的AI數(shù)據(jù)中心,尤其在中文文本數(shù)據(jù)以及多語種等方面有著獨(dú)有優(yōu)勢。
要知道,訊飛人工智能開放平臺作為首批國家新一代人工智能開放創(chuàng)新平臺,日使用量超過50億人次,天然可為大模型投喂海量文本語料和用戶反饋數(shù)據(jù);而多語種翻譯技術(shù)又是訊飛多年深耕的領(lǐng)域,鏈接了全球各語種各行業(yè)的知識。這些都為訓(xùn)練訊飛星火認(rèn)知大模型,幫助其實(shí)現(xiàn)更自然、更智能的對話交互,提供了極大地助力。
而當(dāng)多種類型的數(shù)據(jù)送到一個統(tǒng)一的認(rèn)知智能的大模型中去學(xué)習(xí)和訓(xùn)練,最終可以在通 用領(lǐng)域呈現(xiàn)出讓人驚喜的表現(xiàn)。
“通過這樣一個統(tǒng)一的單模型學(xué)習(xí)之后,我們就會發(fā)現(xiàn)我們的系統(tǒng)會具備了像人類一樣的觸類旁通,在多領(lǐng)域的智慧涌現(xiàn)的令人驚喜的表現(xiàn)。”劉慶峰說道。
于是我們看到,在發(fā)布會現(xiàn)場,科大訊飛圍繞訊飛星火認(rèn)知大模型的文本生成、語言理解、知識問答、邏輯推理、數(shù)學(xué)能力、編程代碼能力、多模態(tài)七大核心能力,進(jìn)行真機(jī)實(shí)測,現(xiàn)場效果驚艷。
像是基礎(chǔ)的問答、長文本生產(chǎn)、數(shù)學(xué)計(jì)算,“星火”都能輕松作答。對于模棱兩可的漢語提 問,“星火”也能出色應(yīng)對:
對英文語法糾錯,也是 信手拈來:
“科大訊飛在國內(nèi)目前已推出的認(rèn)知大模型中,明顯是領(lǐng)先的。英文如果滿分以5分來算,ChatGPT現(xiàn)在是4.48分,而我們已經(jīng)達(dá)到4.29分。”劉慶峰補(bǔ)充道。
在知識問答部分,劉慶峰還特別強(qiáng)調(diào),“星火”擁有訊飛醫(yī)療專業(yè)系統(tǒng)中的一部分通用能力,在醫(yī)療能力上比ChatGPT、GPT4都要強(qiáng)。未來,訊飛還會將與醫(yī)療機(jī)構(gòu)合作中獲得的醫(yī)療專業(yè)知識逐步放到這一通用大模型中,專業(yè)的醫(yī)療領(lǐng)域的模型將 在今年的10月24日正式推出。
現(xiàn)場還隨機(jī)抽取了彈幕問題進(jìn)行實(shí)測。比如,“外星人感冒需要戴口罩嗎?”、“40平米的房子裝成70平米的可行方案?”、“跟女朋友吵架了有什么辦法 解決?”……
因大家的參與熱情過高,原計(jì)劃1個半小時(shí)的實(shí)測延遲到了2個小時(shí),現(xiàn)場觀眾仍是意猶未盡。
不過,發(fā)布會上的 展示或只是“開胃前菜”。在接下里的一段時(shí)間里,訊飛星火大模型將在:
6月9日前, 開啟實(shí)時(shí)問答,升級多輪對話能力 [孫秉辰2] ?;
8月15日前,再次提升代碼能力以及多模態(tài)交互能力;
10月24日前,通用模型在中文能力上超過ChatGPT,在英文能力上與ChatGPT相當(dāng)。
可以看出堅(jiān)定AI賽道的科大訊飛,在整個規(guī)劃和安排上明顯更自信,更自如。
三、長期主義,引領(lǐng)中國智慧涌現(xiàn)
可能單看訊飛星火認(rèn)知大模型的發(fā)布會,不少人已覺得頗為驚喜。但事實(shí)上,星火認(rèn)知大模型的發(fā)布,只不過是科大訊飛“超腦”征程中的一步棋。
2022年伊始,科大訊飛發(fā)布了“訊飛超腦2030計(jì)劃”。計(jì)劃的核心是以價(jià)值創(chuàng)造為根本,通過AI技術(shù)持續(xù)的核心源頭技術(shù)創(chuàng)新和系統(tǒng)性創(chuàng)新,讓機(jī)器遠(yuǎn)不止具備“你問我答”的基礎(chǔ)智能,還擁有更強(qiáng)的交互、運(yùn)動能力,以解決未來社會重大剛需命題。
同時(shí),科大訊飛 將“訊飛超腦2030計(jì)劃”分為三個階段:
階段一:2022-2023年,目標(biāo)為從醫(yī)療、教學(xué)、健康等方面底層的技術(shù)出發(fā),完成軟硬一體機(jī)器人和數(shù)字虛擬人的制造,讓數(shù)字虛擬人在數(shù)字經(jīng)濟(jì)、虛擬世界真正地幫助人類;
階段二:2023-2025年,目標(biāo)為進(jìn)一步發(fā)展到自適應(yīng)行走的外骨骼機(jī)器人,能夠讓外骨骼機(jī)器人真正進(jìn)入到生活之中;
階段三:2025-2030年,目標(biāo)為打造懂知識會學(xué)習(xí)的陪伴機(jī)器人、自主學(xué)習(xí)的虛擬人,讓人工智能擁有交互能力、動作能力。
可以看出,科大訊飛希望從軟硬件兩端都完成機(jī)器人布局。其中,軟件端是虛擬人,硬件端則是陪伴機(jī)器人。
于是我們看到,在去年全球1024開發(fā)者節(jié)上,科大訊飛展示了機(jī)器狗、仿人型機(jī)器人等多種實(shí)體形態(tài)的機(jī)器人?;诳拼笥嶏w超腦平臺,機(jī)器人能夠具備多模感知AI能力,未來還可以持續(xù)提升自主進(jìn)化學(xué)習(xí)能力。
與此同時(shí),科大訊飛的虛擬人交互平臺建設(shè)了虛擬助理、虛擬服務(wù)機(jī)器人、虛擬電商主播、虛擬導(dǎo)游、虛擬IP等數(shù)百個形象和聲音,為各類客戶提供虛擬人解決方案。
目前,科大訊飛AI虛擬人智能交互一體機(jī)產(chǎn) 品已經(jīng)深度觸達(dá)金融、政務(wù)、文旅等多個場景。接入星火認(rèn)知大模型能力之后,虛擬人可以調(diào)用更多能力,支持多輪對話,服 務(wù)也更加細(xì)化。
總之,星火認(rèn)知大模型是“訊飛超腦2030計(jì)劃”的重要階段,其最終目標(biāo)是打造出懂知識、會學(xué)習(xí)的陪伴機(jī)器人和自主學(xué)習(xí)的虛擬人家族,進(jìn)入千家萬戶,解決中國老年社會的問題。
而此前國務(wù)院出臺的《新一代人工智能發(fā)展規(guī)劃》曾提出,“到2025年,中國人工智能核心產(chǎn)業(yè)規(guī)模超過4000億元,帶動相關(guān)產(chǎn)業(yè)規(guī)模超過5萬億元;到2030年,使中國成為世界主要人工智能創(chuàng)新中心”。
作為在人工智能領(lǐng)域的深耕者,科大訊飛耐得住寂寞也守得住繁華。如今,“訊飛超腦2030計(jì)劃”才行至第一階段,隨著“十四五”規(guī)劃將人工智能列為前沿科技領(lǐng)域的“最高優(yōu)先級”,未來等待著科大訊飛的將是更為廣闊的成長空間與發(fā)展紅利。
十年磨一劍,出鞘試鋒芒。 將星火大模型放進(jìn)科大訊飛的發(fā)展過程中來看,僅僅是其人工智能歷程、訊飛超腦計(jì)劃中的一個階段。而始終堅(jiān)持長期主義,讓科大訊飛得以快速打造出技術(shù)實(shí)力領(lǐng)先的國產(chǎn)大模型,也讓其有望在中國率先實(shí)現(xiàn)智慧涌現(xiàn)。
本文來自投稿,不代表增長黑客立場,如若轉(zhuǎn)載,請注明出處:http://gptmaths.com/quan/97099.html