今天凌晨,在一年一度的谷歌I/O開發(fā)者大會上,谷歌CEO桑達(dá)爾·皮查伊?(Sundar Pichai)表示,正在借助生成式AI邁出下一步?!巴ㄟ^大膽而負(fù)責(zé)任的方法,我們正在重新構(gòu)想我們所有的核心產(chǎn)品,包括搜索?!?/p>
在這場備受關(guān)注的大會上,谷歌反復(fù)提到了“AI”,試圖向人們證明自己作為“AI-first company”所歷七年旅程的成果。于是便有了全新的谷歌AI全家桶,但這些和微軟發(fā)布過的產(chǎn)品、功能有何不同呢?
新一代大模型,部分測試表現(xiàn)超過GPT-4
“PaLM 2是我們以負(fù)責(zé)任的方式將AI帶給數(shù)十億人的最新一步,建立在兩個(gè)世界級研究團(tuán)隊(duì)Brain Team和DeepMind取得的進(jìn)展之上。”
谷歌對PaLM 2的重視溢于言表,對標(biāo)GPT-4的意味顯而易見。而其技術(shù)報(bào)告顯示,部分測試表現(xiàn)(如數(shù)學(xué))超過了GPT-4。(報(bào)告詳情:https://ai.google/static/documents/palm2techreport.pdf)
根據(jù)官方介紹,PaLM 2的優(yōu)勢包括:
??多語言性:PaLM 2在多語言文本方面接受了更多訓(xùn)練,涵蓋100多種語言,提高多種語言的理解、生成和翻譯細(xì)微差別文本(包括成語、詩歌和謎語)的能力,甚至通過了“精通”級別的高級語言能力考試。
??推理:PaLM 2的廣泛數(shù)據(jù)集包括科學(xué)論文和包含數(shù)學(xué)表達(dá)式的網(wǎng)頁,展示了邏輯、常識推理和數(shù)學(xué)方面的改進(jìn)能力。
??編碼:PaLM 2在大量公開可用的源代碼數(shù)據(jù)集上進(jìn)行了預(yù)訓(xùn)練,擅長 Python和JavaScript等流行的編程語言,也可生成Prolog、Fortran、Verilog等語言的專用代碼。它不僅能夠理解、生成和調(diào)試代碼,還能解釋原因,以便開發(fā)者在世界各地進(jìn)行協(xié)作。
而PaLM 2還提供了4種不同尺寸——Gecko(壁虎)、Otter(水獺)、Bison(野牛)、Unicorn(獨(dú)角獸)。其中,Gecko非常輕巧,即便在離線時(shí)也可以在移動設(shè)備上快速運(yùn)行。
會上,谷歌還舉了兩個(gè)微調(diào)PaLM 2以在特定領(lǐng)域發(fā)揮作用的例子:
??Sec-PaLM:針對安全用例進(jìn)行微調(diào),可用來更好地檢測、解決惡意腳本。
??Med-PaLM 2:針對醫(yī)學(xué)知識進(jìn)行微調(diào),在醫(yī)學(xué)執(zhí)照考試式問題上表現(xiàn)出“專家”水平,添加的新功能支持合成來自醫(yī)學(xué)成像的信息。
目前,谷歌旗下超過25種產(chǎn)品和功能由PaLM 2提供支持,并已于3月推出預(yù)覽版本。而即日起,開發(fā)人員可以注冊使用PaLM 2模型,客戶可以在具有企業(yè)級隱私、安全和治理的Vertex AI中使用該模型。
此外,谷歌還透露了最近將谷歌大腦和DeepMind合并成一個(gè)團(tuán)隊(duì),即Google DeepMind,并仍在訓(xùn)練下一代基礎(chǔ)模型Gemini(雙子座)。
Gemini旨在實(shí)現(xiàn)多模式、高效的工具和API集成,實(shí)現(xiàn)未來的創(chuàng)新,如記憶和規(guī)劃。經(jīng)過微調(diào)和嚴(yán)格的安全測試后,Gemini同樣將提供多種尺寸。
更新包括圖像功能、編碼功能和應(yīng)用程序集成
作為對標(biāo)ChatGPT的AI聊天機(jī)器人,Bard更新包括圖像功能、編碼功能和應(yīng)用程序集成。其借由全面接入PaLM 2新一代大模型,提升了在數(shù)學(xué)、推理和編碼等方面的能力。
Bard此次更新的亮點(diǎn)集中在其聊天問答支持圖像互動。比如詢問旅游攻略,能夠得到圖文并茂的回答;提問中包含小狗照片,Bard能借助Google Lens對照片進(jìn)行分析,在幾秒內(nèi)檢測品種,并起草創(chuàng)造性的說明文字。
但最受人們歡迎的還是Bard在引入編碼和導(dǎo)出功能上的表現(xiàn):
??來源引用:引用從下周開始更加精確。如果Bard引入了一段代碼或引用了其他內(nèi)容,只需單擊注釋,Bard會在這些部分下劃線并鏈接到源代碼。
??深色主題:這是開發(fā)人員要求的功能,有助于更輕松地與巴德互動。
??“導(dǎo)出”按鈕:應(yīng)廣大開發(fā)者要求,與Replit合作推出一鍵導(dǎo)入功能,支持將Bard生成的代碼直接導(dǎo)出到Colab,從 Python 開始。
此外,Bard還新增了兩個(gè)導(dǎo)出操作,可以輕松地將Bard的回復(fù)直接轉(zhuǎn)移到Gmail和Docs中。而諸如Drive、地圖等谷歌的應(yīng)用程序和服務(wù)功能也都集成到了Bard的體驗(yàn)中。
除了自家應(yīng)用功能的集成,Bard還將能利用來自整個(gè)網(wǎng)絡(luò)的各種服務(wù),及來自外部合作伙伴的擴(kuò)展。谷歌透露,在接下來的幾個(gè)月里,將把Adobe的創(chuàng)意生成AI模型系列Adobe Firefly集成到Bard中,幫助用戶創(chuàng)意作圖,解決版權(quán)的后顧之憂,并支持進(jìn)一步編輯或添加設(shè)計(jì)到Adobe Express。
值得一提的是,Adobe只是開始,后續(xù)還會同Kayak、OpenTable、ZipRecruiter、Instacart、Wolfram、Khan Academy等開展合作,以增加Bard服務(wù)的可能性。
此外,即日起,Bard取消了候補(bǔ)名單,向180多個(gè)國家和地區(qū)開放,并新增了日語和韓語版本,很快將支持40種語言。
使用生成式AI,開啟AI對話
隨著生成式AI的新突破,谷歌開始重構(gòu)搜索引擎,解鎖全新問題類型,并通過改變信息組織方式來幫助用戶整理并理解其中的內(nèi)容。
更直白來說,對于“對于有 3 歲以下孩子和狗的家庭來說,去布萊斯峽谷還是拱門更好”這樣的問題,以前需要用戶通過自己把它拆成各種小問題去搜索并整理大量信息,才能找到答案,如今可以借助生成式AI一步到位。
在升級之后的搜索引擎,用戶可以看到需要考慮的關(guān)鍵信息的AI驅(qū)動快照,以及每一個(gè)建議的依據(jù)鏈接。而在快照下方,用戶還可以看到繼續(xù)提出問題的提示,如“與孩子一起在布萊斯峽谷度過多長時(shí)間”等,點(diǎn)擊即可便捷地打開新的對話。
借助這種能力,搜索中的生成式AI還能夠幫助用戶在搜索產(chǎn)品時(shí),快速了解需要考慮的因素和符合要求的產(chǎn)品,并將獲得產(chǎn)品說明,包括相關(guān)的最新評論、評級、價(jià)格和產(chǎn)品圖片,以做出理性的購物決定。
這種AI購物體驗(yàn)建立在谷歌的Shopping Graph之上,其擁有超過350億個(gè)產(chǎn)品列表,是世界上最全面的不斷變化的產(chǎn)品、賣家、品牌、評論和庫存數(shù)據(jù)集,每小時(shí)刷新超18億個(gè)列表,為用戶提供新鮮、可靠的結(jié)果。
值得一提的是,谷歌仍然認(rèn)為廣告是網(wǎng)絡(luò)運(yùn)作方式的重要組成部分,因此搜索廣告將繼續(xù)出現(xiàn)在頁面的專用廣告位中,但會確保與自然搜索結(jié)果區(qū)分開來。
此外,谷歌還開放了搜索實(shí)驗(yàn)室的注冊。谷歌稱正在搜索實(shí)驗(yàn)室中進(jìn)行一項(xiàng)名為SGE(搜索生成體驗(yàn))的實(shí)驗(yàn),未來幾周內(nèi)將開放,但暫時(shí)只支持美國用戶使用。(申請鏈接:https://labs.google.com/search)
辦公軟件的AI助手,對標(biāo)微軟Copilot
谷歌將Duet AI定義為“一個(gè)永遠(yuǎn)在線的人工智能協(xié)作者”,并在發(fā)布會現(xiàn)場展示了其在兩種場景中的應(yīng)用。
1、Workspace(申請鏈接:https://workspace.google.com/labs-sign-up/)
Workspace是谷歌旗下的實(shí)時(shí)協(xié)作辦公平臺,嵌入Duet AI后將創(chuàng)造全新的工作方式,其新能力包括:
??幫助寫作:在Gmail中,根據(jù)用戶輸入的提示來起草完整的回復(fù),并補(bǔ)充郵件內(nèi)容;在Docs中,輔助用戶寫內(nèi)容之余,還能提供用于位置和狀態(tài)等信息的智能芯片,以及自定義的詳細(xì)信息變量。
??生成PPT:根據(jù)用戶輸入的提示,直接在Google PPT中從文本創(chuàng)建原始圖像,甚至可以將從未存在過的事物形象化為圖片素材。
??生成表格:通過自動數(shù)據(jù)分類和創(chuàng)建自定義計(jì)劃,幫助用戶更快地分析和處理表格數(shù)據(jù)。
??自定義視頻通話背景:為用戶的視頻通話生成獨(dú)特背景,便于用戶在視頻通話期間表達(dá)自己并加深聯(lián)系,同時(shí)保護(hù)周圍環(huán)境的隱私。
2、谷歌云(申請鏈接:https://cloud.google.com/ai/earlyaccess/join?hl=en)
Duet AI在谷歌云上能提供的新功能包括:
??代碼輔助:位實(shí)時(shí)輸入時(shí)提供代碼建議,生成完整的函數(shù)和代碼塊,識別代碼中的漏洞和錯(cuò)誤,同時(shí)提出修復(fù)建議。
??聊天幫助:允許用戶使用簡單的自然語言來獲得有關(guān)特定開發(fā)或云相關(guān)問題的答案,還可以提供架構(gòu)或編碼最佳實(shí)踐,減少搜索相關(guān)文檔的需要。
??適用于App Sheet:允許用戶創(chuàng)建智能業(yè)務(wù)應(yīng)用程序、連接他們的數(shù)據(jù),并通過自然語言將工作流構(gòu)建到 Google Workspace 中。
此外,谷歌云還在機(jī)器學(xué)習(xí)平臺Vertex AI上新了三款大模型:
??代碼生成基礎(chǔ)模型Codey:通過代碼生成、完成、聊天加速軟件開發(fā)。 ??文生圖基礎(chǔ)模型Imagen:生成和定制工作室級圖像。
??先進(jìn)語音模型Chirp:支持語音控制、字幕和語音輔助等語音任務(wù)。
AI對于谷歌來說,一方面是必須和微軟重分江山的賽道,一方面也是助力產(chǎn)品升級的跳板。
比如,谷歌在這場大會上海提到了幾個(gè)利用AI技術(shù)改進(jìn)的產(chǎn)品,包括為了沉浸式地圖Immersive View、方便圖片編輯的Magic Editor、讓安卓手機(jī)更加個(gè)性化的Magic Compose、Cinematic Wallpapers 和 Generative AI Wallpapers等。
而為了應(yīng)對AI帶來的信息風(fēng)險(xiǎn),谷歌還將推出兩種工具——水印和元數(shù)據(jù),以便于未來識別AI生成內(nèi)容。
谷歌此次爆炸式地推出AI全家桶,讓不少支持者重燃了對這位搜索領(lǐng)域老大哥的信心。但也有不少用戶認(rèn)為,都是微軟玩剩下的東西。
從目前的產(chǎn)品和功能上來看確實(shí)有點(diǎn)走微軟老路的意思,不過我們也需要認(rèn)知到,谷歌在AI一道上追趕微軟的時(shí)間并不長,就能夠做出看起來和微軟“差不多”的產(chǎn)品。再者,微軟目前用的是OpenAI的技術(shù),而谷歌的技術(shù)都來源于自身,這又會不會成為AI大戰(zhàn)后期的關(guān)鍵影響因素呢?
在科技日新月異的這幾個(gè)月里,經(jīng)歷洗禮的所有人都明白了一個(gè)共同的道理,這個(gè)世界正在發(fā)生巨變,搜索引擎的競爭不過是縮影,正如谷歌或許也沒想到自己多年的首位竟可能被AI顛覆,未到終局,難下定論。我們所需要做的是,好好利用這些不斷涌出的新工具,以抵御未來的科技風(fēng)暴。
本文來自投稿,不代表增長黑客立場,如若轉(zhuǎn)載,請注明出處:http://gptmaths.com/cgo/product/97318.html