文|白 鴿
編|王一粟
繼9月份版本更新之后,光錐智能從生數(shù)科技聯(lián)合創(chuàng)始人兼CEO唐家渝朋友圈獲悉,Vidu大模型將于本周再次進(jìn)行版本升級(jí),Vidu-1.5版本即將上線(xiàn)。
此版本更新方向仍是重點(diǎn)延伸大模型的泛化能力和主體一致性問(wèn)題。上一版本重點(diǎn)是單一主體的一致性,而最新版本則能夠理解和整合人物、物體、環(huán)境等多個(gè)概念,遵循用戶(hù)指令30秒內(nèi)生成多個(gè)主體融合的相關(guān)視頻結(jié)果,率先實(shí)現(xiàn)視頻創(chuàng)作中的多主體一致性生成。
除Vidu外,自今年9月份以來(lái),據(jù)不完全統(tǒng)計(jì),包括字節(jié)旗下即夢(mèng)AI、快手可靈AI、Runway、智譜清影、愛(ài)詩(shī)科技PixVerse、Pika等主流的AI視頻生成平臺(tái),都已經(jīng)進(jìn)行了版本更新。
當(dāng)前,在爆火的AI視頻生成賽道中,大模型創(chuàng)企、互聯(lián)網(wǎng)大廠(chǎng)等紛紛入局,而在經(jīng)過(guò)前期各家密集進(jìn)行產(chǎn)品發(fā)布階段后,如今已進(jìn)入產(chǎn)品迭代升級(jí)比拼階段。
通過(guò)各家版本更新的內(nèi)容,不難發(fā)現(xiàn),AI視頻生成大模型能力迭代的大方向,仍是生成視頻的時(shí)長(zhǎng)、畫(huà)面的穩(wěn)定性、連續(xù)性和主體前后的一致性上。
但與此同時(shí),各個(gè)玩家又在實(shí)際功能應(yīng)用中,開(kāi)始出現(xiàn)“分野”,各有側(cè)重,部分中小玩家也開(kāi)始找到自己的細(xì)分市場(chǎng)。
比如Runway最新版本中更新了可將真人面部表情精確復(fù)刻給AI角色的Act-One,以能夠?qū)崿F(xiàn)3D化的AI攝像頭控件。PixVerse則上線(xiàn)了各種萬(wàn)圣節(jié)特效、毒液特效等。
對(duì)此輪各AI視頻生成平臺(tái)的更新,星賢文化創(chuàng)始人、AI原創(chuàng)玄幻IP《山海奇鏡》制作人陳坤認(rèn)為:“最大的更新應(yīng)該是Act-One這種表情遷移,提供了人物表演的基礎(chǔ)可能性?!倍鴮?duì)于人物主體的一致性和穩(wěn)定性,“有進(jìn)步,但并沒(méi)有代際型進(jìn)步?!?/p>
在A(yíng)I視頻創(chuàng)作者尾鰭Vicky看來(lái),相比上半年初代產(chǎn)品,最新更新的AI視頻平臺(tái),除了在底層模型能力上的迭代之外,在功能上也進(jìn)行了更新,比如首尾針、畫(huà)質(zhì)和幀率的補(bǔ)足、配音等功能,“這些功能的完善,實(shí)際上是比上半年更全面。”
如果說(shuō)2024上半年,是AI視頻生成賽道的軍備競(jìng)賽,那么下半年則是進(jìn)入小步快跑的版本更新周期。
而在此階段,字節(jié)和快手的交鋒仍在激烈進(jìn)行中,中小廠(chǎng)商開(kāi)始找到自己獨(dú)特賽道,而一些企業(yè)專(zhuān)注走海外市場(chǎng),也實(shí)現(xiàn)了“國(guó)內(nèi)開(kāi)花,墻外香”的效果。
無(wú)疑,這一階段的廝殺,看似溫和,但卻實(shí)質(zhì)性的影響平臺(tái)自身的定位和未來(lái)發(fā)展的方向,以及后續(xù)用戶(hù)群體和數(shù)量規(guī)模的可持續(xù)增長(zhǎng)。
字節(jié)狂追,快手搶跑
“即夢(mèng)有些掉隊(duì)?!边@是AI視頻生成平臺(tái)用戶(hù)給出的客觀(guān)評(píng)價(jià)。
作為去年第一批的AI視頻生成平臺(tái),以及字節(jié)旗下的產(chǎn)品,即夢(mèng)AI的視頻生成效果一直備受使用者詬病,處于被Runway、Pika等同一批玩家吊打的狀態(tài)。
今年6月,字節(jié)在短視頻領(lǐng)域的直接競(jìng)爭(zhēng)對(duì)手——快手,正式在官網(wǎng)上線(xiàn)了“可靈”視頻生成大模型,并火速出圈。同時(shí),越來(lái)越多AI視頻生成平臺(tái)如雨后春筍般推出,AI視頻生成賽道徹底爆火。
在強(qiáng)大競(jìng)爭(zhēng)壓力之下,作為國(guó)內(nèi)AI產(chǎn)品第一梯隊(duì),補(bǔ)上視頻生成這一塊短板,已成為字節(jié)跳動(dòng)面臨的當(dāng)務(wù)之急,而其奮起直追的速度也超乎想象。
9月24日,2024火山引擎AI創(chuàng)新巡展深圳舉辦,原抖音藝術(shù)負(fù)責(zé)人陳欣然以即夢(mèng)AI及剪映市場(chǎng)和運(yùn)營(yíng)負(fù)責(zé)人的身份亮相,并宣布即夢(mèng)AI已經(jīng)接入了豆包最新的視頻生成模型。
同期,字節(jié)跳動(dòng)發(fā)布豆包模型家族的兩款視頻生成模型Seaweed和Pixeldance,并通過(guò)即夢(mèng) AI、火山引擎分別面向創(chuàng)作者和企業(yè)客戶(hù)小范圍邀測(cè)。
11月8日,字節(jié)跳動(dòng)旗下的AI內(nèi)容平臺(tái)即夢(mèng)AI宣布,由字節(jié)跳動(dòng)自研的視頻生成模型Seaweed面向平臺(tái)用戶(hù)正式開(kāi)放。
據(jù)字節(jié)跳動(dòng)方面介紹,本次開(kāi)放使用的豆包視頻生成模型Seaweed是該款模型的標(biāo)準(zhǔn)版,僅需60秒即能生成時(shí)長(zhǎng)5秒的高質(zhì)量AI視頻,領(lǐng)先國(guó)內(nèi)業(yè)界3至5分鐘的所需生成時(shí)間。
即夢(mèng)AI還透露,近期Seaweed和Pixeldance兩款視頻生成模型的Pro版也將開(kāi)放使用。Pro 版模型能實(shí)現(xiàn)自然連貫的多拍動(dòng)作與多主體復(fù)雜交互,攻克了多鏡頭切換的一致性難題,在鏡頭切換時(shí)可同時(shí)保持主體、風(fēng)格、氛圍的一致性,適配電影、電視、電腦、手機(jī)等各種設(shè)備的比例。
字節(jié)抖音和快手,作為國(guó)內(nèi)短視頻平臺(tái)的領(lǐng)軍者,雙方的競(jìng)爭(zhēng)已經(jīng)從短視頻、電商轉(zhuǎn)移至AI領(lǐng)域,客觀(guān)來(lái)說(shuō),抖音在各方面都?jí)嚎焓忠活^。但唯獨(dú)在A(yíng)I領(lǐng)域,快手給出了漂亮的反擊。
自6月一鳴驚人之后,快手可靈其實(shí)已經(jīng)有數(shù)次的小版本的迭代。
但在底層大模型能力上,今年9月20日,快手發(fā)布可靈1.5版本,接入新一代模型,實(shí)現(xiàn)了畫(huà)質(zhì)和動(dòng)態(tài)質(zhì)量都大幅提升,原有的模型也加入了新功能——運(yùn)動(dòng)筆刷,生成效果可控性增強(qiáng)。
“可靈1.5很強(qiáng),可以說(shuō)是所有模型里面最真實(shí)的,吊打Runway,基本上已經(jīng)克服了之前人物變形的問(wèn)題?!盇IGC創(chuàng)業(yè)者洋芋醬AIgen(藝名)如此對(duì)光錐智能說(shuō)道。
在實(shí)際生成的視頻效果中,對(duì)比可靈和Runway,可以看到,同一個(gè)提示詞,兩者在實(shí)際人物主體的穩(wěn)定性上效果都很強(qiáng),但可靈生成出的視頻效果能夠自動(dòng)解鎖面部表情。
“Runway其實(shí)也能自主生成面部表情,但效果非常詭異?!毖笥筢uAIgen如此說(shuō)道,不過(guò),可靈AI和Runway這種能力是隨機(jī)的,并不固定。
這其實(shí)也能夠看到,可靈AI和Runway在實(shí)際生成效果上更勝一籌,而在對(duì)提示詞的理解上,可靈AI也確實(shí)走在前列,但未來(lái)也仍需要不斷迭代升級(jí),才能將這一能力固化下來(lái)。
(Runway,提示詞一個(gè)穿著新中式服裝的女模特,正在展示自己的造型,背景是彩色的煙霧飄散,洋芋醬AIgen提供)
(可靈AI,提示詞一個(gè)穿著新中式服裝的女模特,正在展示自己的造型,背景是彩色的煙霧飄散,洋芋醬AIgen提供)
不過(guò),此次即夢(mèng)上線(xiàn)最新視頻生成大模型之后,尾鰭Vicky則認(rèn)為其在模型能力和UI設(shè)計(jì)上,與可靈差距不大。同時(shí),在內(nèi)測(cè)即夢(mèng)平臺(tái)Pro版模型的時(shí)候,其能夠輕松控制畫(huà)面的運(yùn)動(dòng)幅度和動(dòng)作。
作為國(guó)內(nèi)頭部的短視頻平臺(tái),快手和字節(jié),在A(yíng)I視頻生成賽道的布局,終局目的是要吸引和留住用戶(hù)的注意力,而這就需要不斷生產(chǎn)出新穎、有質(zhì)量、有創(chuàng)意的內(nèi)容。
基于此,AI短劇,也成為字節(jié)即夢(mèng)和快手可靈競(jìng)爭(zhēng)的焦點(diǎn)之一。
今年7月份,由“可靈AI”創(chuàng)作出的AI短劇《山海奇鏡之劈波斬浪》引發(fā)廣泛關(guān)注,該短劇成為國(guó)內(nèi)首部AIGC原創(chuàng)奇幻微短劇。
9月,快手星芒短劇聯(lián)合“可靈AI”推出了“星有靈犀-AI短劇創(chuàng)作大賽”。據(jù)悉,大賽以流量獎(jiǎng)勵(lì)、榮譽(yù)獎(jiǎng)勵(lì)、內(nèi)容簽約等多項(xiàng)舉措激勵(lì)更多人加入AI短劇創(chuàng)作。
字節(jié)同樣不甘示弱,即夢(mèng)AI在聯(lián)手博納影業(yè)發(fā)布首部AIGC生成科幻短劇《三星堆:未來(lái)啟示錄》的同時(shí),也在聯(lián)手抖音平臺(tái)多位“超級(jí)創(chuàng)作者”實(shí)現(xiàn)共創(chuàng),邀請(qǐng)平臺(tái)上有高質(zhì)量粉絲及高影響力的達(dá)人,共同加入“超級(jí)創(chuàng)作者聯(lián)盟”計(jì)劃,希望借此打造國(guó)內(nèi)最大的虛擬創(chuàng)作社群。
但現(xiàn)階段不管是抖音,還是快手,其視頻平臺(tái)的影視創(chuàng)作者創(chuàng)作的內(nèi)容,“很難破圈兒?!蔽馋扸icky如此說(shuō)道,“因?yàn)楝F(xiàn)在整個(gè)市場(chǎng)尚未形成,C端用戶(hù)并不知道用它來(lái)干嘛。頭部會(huì)有一些商業(yè)化需求,但需求并不多,整體并不穩(wěn)定?!?/strong>
畢竟,現(xiàn)階段全球的專(zhuān)業(yè)創(chuàng)作者還比較少,且AI視頻生成大模型技術(shù)尚處于早期階段。
因此,作為頭部視頻平臺(tái),字節(jié)和快手之間的競(jìng)爭(zhēng)也日趨激烈,而除了底層AI技術(shù)、產(chǎn)品之爭(zhēng)外,更重要的則在于誰(shuí)能夠率先探索出技術(shù)賦能內(nèi)容之路。畢竟,平臺(tái)如果能夠聚集更多具有創(chuàng)新意識(shí)的內(nèi)容創(chuàng)作者,就能夠打造出一個(gè)更受用戶(hù)關(guān)注和喜愛(ài)的社區(qū)生態(tài)。
當(dāng)然,除了字節(jié)和快手之外,在A(yíng)I視頻生成賽道中的其他玩家,也開(kāi)始出現(xiàn)“分野”,部分中小廠(chǎng)商,也開(kāi)始探索并走出了一條屬于自己的差異化競(jìng)爭(zhēng)之路。
細(xì)分市場(chǎng)崛起,找準(zhǔn)自身定位是王道
在抖音、快手等短視頻平臺(tái)上,一些創(chuàng)作者創(chuàng)作的內(nèi)容可能破圈兒難度比較大,但一些包含鬼畜特效的視頻,卻異常的火爆,比如由AI生成的何炅和黃磊突然打架的視頻。
對(duì)于A(yíng)I視頻生成賽道的玩家來(lái)說(shuō),如果字節(jié)和快手,是全方位的技術(shù)和內(nèi)容生態(tài)體系的競(jìng)爭(zhēng),而其他中小玩家更多的則是聚焦在細(xì)分賽道,找準(zhǔn)自身平臺(tái)和產(chǎn)品定位,則成為生存發(fā)展的基礎(chǔ)。
10月底,Runway的CEO在公開(kāi)信中明確表示, Runway并不是一家AI公司,而是一家媒體和娛樂(lè)公司,“我認(rèn)為 AI 公司的時(shí)代已經(jīng)結(jié)束了。”
基于此,在各大公司爭(zhēng)相卷AI視頻生成長(zhǎng)度、逼真度、流暢度的時(shí)候,Runway顯然已經(jīng)在A(yíng)I視頻賽道中走出了自己的特色——做專(zhuān)門(mén)服務(wù)于藝術(shù)、媒體和娛樂(lè)的AI。
從Runway的實(shí)際視頻生成效果來(lái)看,其在人物穩(wěn)定性、一致性上的效果可以說(shuō)走在前列。而除了基礎(chǔ)技術(shù)能力外,在最新的版本更新中,Runway上線(xiàn)的2個(gè)新功能雖小,但都將為動(dòng)畫(huà)師、游戲開(kāi)發(fā)者和電影制作人提供非常大的便利、節(jié)約巨大的成本。
Runway可以說(shuō)是最受影視從業(yè)者歡迎的產(chǎn)品之一,除技術(shù)實(shí)力之外,更重要的還在于性?xún)r(jià)比。
“ Runway實(shí)在是太香了,我們用可靈都是省著用,但是Runway是無(wú)限次數(shù)的,每天抽個(gè)幾百次都無(wú)所謂。”洋芋醬AIgen表示,“AI視頻的隨機(jī)性還是很強(qiáng)的,如果按次收費(fèi),普通創(chuàng)作者可能很難承受起這個(gè)成本?!?/p>
反觀(guān)可靈,如果用1000元購(gòu)買(mǎi)積分,能夠購(gòu)買(mǎi)15000可靈值,每次用35可靈值,1000元只能生成428次。對(duì)于真正的創(chuàng)業(yè)者來(lái)說(shuō),基本不夠用,“按照我在Runway每天要生成兩百多次視頻的頻率來(lái)看,可靈1000元購(gòu)買(mǎi)的積分基本2天就燒完了?!毖笥筢uAIgen如此說(shuō)道。
在光錐智能上一篇《爆“卷”的AI視頻,大廠(chǎng)向左,創(chuàng)企向右》文章中也提到過(guò),對(duì)于現(xiàn)階段各平臺(tái)采用的會(huì)員制收費(fèi)方式,對(duì)于不能夠商業(yè)化閉環(huán)的創(chuàng)業(yè)者而言,后續(xù)的付費(fèi)率和付費(fèi)意愿都不會(huì)很高。而現(xiàn)如今看來(lái),對(duì)于即使能夠?qū)崿F(xiàn)商業(yè)化閉環(huán)的創(chuàng)業(yè)者而言,性?xún)r(jià)比也是影響其使用產(chǎn)品的關(guān)鍵因素。
而除了Runway之外,Pika和Pixverse也找到了自己的賽道。從他們最新更新的版本中可以看到,這兩家重點(diǎn)是訓(xùn)練了一些用戶(hù)能夠直接使用的特效效果,“雖然比喻可能會(huì)不太恰當(dāng),但是有點(diǎn)接近之前抖音做的那種貼紙?!毖笥筢uAIgen說(shuō)道。
比如在10月底萬(wàn)圣節(jié)期間,PixVerse V3版本新增了不少萬(wàn)圣節(jié)主題的特效,包括僵尸模式、巫師帽和怪物入侵等主題效果,還有類(lèi)似于Pika很火的AI捏捏特效,視頻延長(zhǎng)功能,用戶(hù)可以為已有視頻額外增加5-8秒的內(nèi)容,并能精確控制新增片段的內(nèi)容走向。
而隨著最近《毒液:最后一舞》電影的上映,PixVerse基于最新視頻模型PixVerse V3推出了新特效“我們是毒液”的視頻效果,能夠一鍵將圖片生成酷炫毒液動(dòng)畫(huà)。
圖源:尾鰭Vicky
當(dāng)前,在社交平臺(tái)上,這種鬼畜特效非常受用戶(hù)歡迎。此前Pika在1.5版本中,就推出了AI捏捏的特效,一經(jīng)推出,就備受用戶(hù)喜愛(ài),其也靠著這一波特效,實(shí)現(xiàn)了彎道超車(chē)。而和Pika差不多時(shí)間開(kāi)始增長(zhǎng)的海螺AI,其實(shí)也是靠人物表演和meme表情包直接拉爆了海外輿論,彎道超車(chē)。
事實(shí)上,盡管海螺AI推出時(shí)間較晚,但行業(yè)從業(yè)者對(duì)海螺AI的評(píng)價(jià)并不低?!昂B軦I在人物動(dòng)作上的表現(xiàn)很厲害,最近何炅和黃磊打架的AI生成視頻,就是通過(guò)海螺AI生成。”洋芋醬AIgen說(shuō)道。
不過(guò),海螺AI更重要的是實(shí)現(xiàn)了“國(guó)內(nèi)開(kāi)花,墻外香”的效果。作為國(guó)內(nèi)AI公司MiniMax在海外推出的AI視頻生成平臺(tái),其一經(jīng)推出,搜索熱度持續(xù)攀升。
據(jù)“AI產(chǎn)品榜”統(tǒng)計(jì),海螺AI網(wǎng)頁(yè)版9月訪(fǎng)問(wèn)量大漲860%,登頂9月全球及國(guó)內(nèi)增速榜首。海外用戶(hù)紛紛在社交平臺(tái)分享使用體驗(yàn),普遍認(rèn)為海螺AI是目前市面上最出色的AI視頻生成工具之一。
而憑借產(chǎn)品在海外市場(chǎng)的爆火,MiniMax在商業(yè)化能力上,已經(jīng)走在大模型六小虎的前列。
相比較來(lái)說(shuō),像Vidu和智譜清影這一類(lèi)的平臺(tái),在主體一致性和人物穩(wěn)定性中,視頻生成時(shí)長(zhǎng)等方向上正在不斷進(jìn)化,但尚未形成專(zhuān)屬于自己風(fēng)格的賽道和獨(dú)特的競(jìng)爭(zhēng)優(yōu)勢(shì)。
盡管AI視頻生成技術(shù)正不斷進(jìn)化,并衍生出具有特色的細(xì)分賽道。但信達(dá)證券研報(bào)也顯示,AI視頻生成技術(shù)在人物一致性、所需時(shí)長(zhǎng)、畫(huà)面質(zhì)量等方面仍需進(jìn)一步提升,以滿(mǎn)足商業(yè)化水準(zhǔn)。
同時(shí),目前主流AI視頻工具還處在視頻生成競(jìng)爭(zhēng)的階段,且大多數(shù)為單一功能產(chǎn)品,仍需要多種不同的視頻創(chuàng)作工具串聯(lián)使用才能達(dá)到直接輸出可商業(yè)化視頻的效果。
未來(lái),AI視頻生成大模型平臺(tái),仍需要不斷迭代進(jìn)化。
本文來(lái)自投稿,不代表增長(zhǎng)黑客立場(chǎng),如若轉(zhuǎn)載,請(qǐng)注明出處:http://gptmaths.com/cgo/126512.html