文|郝 ?? 鑫
爆火于元宇宙,轉(zhuǎn)而銷聲匿跡,又在大模型來臨后死灰復(fù)燃,眼看著一波波創(chuàng)業(yè)公司倒在黎明前,一波波新生力量又在風(fēng)口爆發(fā)后崛起,風(fēng)險(xiǎn)與機(jī)會(huì)齊飛。
想要在曲折而不確定性的虛擬人賽道找尋發(fā)展的確定性,通過虛擬人來穿越技術(shù)和經(jīng)濟(jì)的發(fā)展周期成為一件極其困難的事情。
魔琺科技,這家從元宇宙開始到現(xiàn)在始終堅(jiān)持3D虛擬人方向的公司,用每個(gè)階段不同的技術(shù)探索以及對(duì)虛擬人的認(rèn)知更新來回答“如何穿越周期”這個(gè)問題。
不管行業(yè)如何變化,自成立至今,魔琺一直在探索3D虛擬人的生成路徑。
2018年成立初期,魔琺將構(gòu)建元宇宙的基礎(chǔ)設(shè)施為核心目標(biāo),并提出了“虛擬+X”的概念,掌握了全棧式的虛擬內(nèi)容智能化制作技術(shù),打造了虛擬直播和線下實(shí)時(shí)互動(dòng)產(chǎn)品以及三維AI虛擬人能力平臺(tái)。
2023年,大模型和AIGC技術(shù)讓虛擬人實(shí)現(xiàn)突破,魔琺重新定義AIGC時(shí)代的虛擬人,并發(fā)布了虛擬人直播 AIGC 平臺(tái) “ 魔琺有光”、虛擬人視頻 AIGC 平臺(tái) “ 魔琺有言 ”和虛擬人服務(wù) AIGC 平臺(tái) “ 魔琺有靈 ”,三款超寫實(shí) 3D 虛擬人產(chǎn)品。
魔琺CEO柴金祥表示:“3D虛擬人具有高質(zhì)量超寫實(shí)形象,能表達(dá),可互動(dòng),且是AIGC生成的”,要同時(shí)具備超寫實(shí)3D形象、生動(dòng)的表達(dá)能力和垂直領(lǐng)域的專業(yè)能力。
從更宏觀的角度,柴金祥認(rèn)為,“文生文、文生圖、文生視頻都只不過是AIGC的能力,而AIGC演進(jìn)的終極形態(tài)一定是3D虛擬人。”
2024年開年,Sora炸翻了天,令國內(nèi)的創(chuàng)業(yè)公司和投資人感到震驚和恐慌。在這樣的背景下,手握3D虛擬人AIGC視頻生成平臺(tái)且已經(jīng)開始產(chǎn)品化的魔琺,顯得格外冷靜。
柴金祥認(rèn)為,Sora的路線不一定適合中國企業(yè),Sora走2D視頻生成路線,更適合創(chuàng)意類視頻生成;魔琺選擇走3D視頻生成路線,滿足企業(yè)對(duì)信息復(fù)雜度、精準(zhǔn)性輸出的需求。
回顧魔琺的發(fā)展,其核心能力是在3D虛擬人的核心能力上做加法,以前是3D虛擬人+元宇宙,現(xiàn)在是3D虛擬人AIGC+圖文、視頻,再加電商直播、教育、文旅等千行百業(yè)。變的是整個(gè)時(shí)代發(fā)展脈絡(luò),不變的是核心技術(shù)能力和產(chǎn)品能力。
在與行業(yè)結(jié)合的過程中,柴金祥形成了自己對(duì)科技公司商業(yè)化的思考。他認(rèn)為,對(duì)魔琺在內(nèi)的所有科技企業(yè)來說最重要的還是PMF(Product Market Fit 產(chǎn)品市場(chǎng)匹配度),即能不能找到更契合市場(chǎng)的產(chǎn)品,多長時(shí)間能得到驗(yàn)證。此外就是,在這款產(chǎn)品的增長過程中,能不能實(shí)現(xiàn)規(guī)?;?。
柴金祥介紹,魔琺從早期做項(xiàng)目再到產(chǎn)品化就是在不斷尋找規(guī)?;耐黄泣c(diǎn),“現(xiàn)在3D虛擬人視頻生成產(chǎn)品的成本基本是GPU的成本”,如果有一天達(dá)到了PMF,后面的任務(wù)就是持續(xù)保持用戶增長。
帶著這樣的視角,光錐智能對(duì)話魔琺創(chuàng)始人兼CEO柴金祥,深入理解魔琺穿越技術(shù)周期的思路以及對(duì)虛擬人產(chǎn)品化的實(shí)踐。
核心觀點(diǎn)如下:
1、文生視頻存在兩條路徑:一條是Sora,用大規(guī)模視頻數(shù)據(jù)訓(xùn)練大模型,生成2D視頻內(nèi)容;一條是3D內(nèi)容的AIGC,通過3D物理引擎渲染生成視頻。
2、魔琺要做的是3D超寫實(shí)虛擬AIGC+X,每家企業(yè)都能有一個(gè)AIGC 3D虛擬人,這個(gè)虛擬人有形象、會(huì)表達(dá)且夠?qū)I(yè)。
3、3D視頻生成的核心難點(diǎn)是缺乏高質(zhì)量的3D數(shù)據(jù),其次才是算力、算法。
4、對(duì)科技企業(yè)來說最重要的還是PMF(Product Market Fit 產(chǎn)品市場(chǎng)匹配度),即能不能找到更契合市場(chǎng)的產(chǎn)品,多長時(shí)間能得到驗(yàn)證。
5、在OpenAI的延長線上的公司都很危險(xiǎn),Sora更適合創(chuàng)意類視頻生成。
以下為對(duì)話實(shí)錄:
Q:Sora的爆火點(diǎn)燃了 AI 視頻賽道的戰(zhàn)火,Sora就是最佳路徑嗎?魔琺選擇的是哪條技術(shù)路徑?
A:文生圖片、文生視頻、文生3D從視頻的AIGC角度來說,有兩條核心路徑:一條路徑就是最近比較火的Sora路徑,它生成的是2D視頻,從互聯(lián)網(wǎng)上獲取大量的視頻數(shù)據(jù)來訓(xùn)練大模型,然后輸出生成視頻。像Pika、Runway這些美國公司以前都是走同一個(gè)路徑,只是效果做得相對(duì)較差,中國現(xiàn)在想完全照搬也不一定能學(xué)成。
還有一條路徑,就是3D內(nèi)容的AIGC,這也是魔琺現(xiàn)在選擇的道路。無論國內(nèi)外,三維內(nèi)容AIGC大家多多少少都有聽過,但是沒見過產(chǎn)品,也沒見過好的Demo,導(dǎo)致對(duì)3D內(nèi)容的AIGC其實(shí)缺乏一定的概念。
Q:什么是3D虛擬人AIGC產(chǎn)品?
A:我們定義里的3D虛擬人,我自己認(rèn)為它是一種最高級(jí)的內(nèi)容形態(tài)。意思是說,通過虛擬人可以復(fù)制無窮個(gè)自己,從而打破時(shí)間、空間的限制,也能和任意的節(jié)點(diǎn)產(chǎn)生聯(lián)系和互動(dòng),達(dá)到一種隨時(shí)在線的狀態(tài)。我們認(rèn)為它是比圖文、比視頻更高級(jí)的形態(tài),因?yàn)樗前阉袞|西都結(jié)合起來,本質(zhì)上是一個(gè)智能體。
我們的AIGC體現(xiàn)在哪里?視頻里人物的所有表達(dá)都是AIGC生成的,包括他的表情、眼神、手勢(shì)、動(dòng)作、聲音等等。現(xiàn)在,AIGC的功能體現(xiàn)是文本腳本生成,我們3月底的下一個(gè)版本,大家會(huì)看到把我們自己的大模型、文本大模型結(jié)合進(jìn)去,用戶直接輸入prompt 就能完成操作。
Q:虛擬人賽道的廠商和企業(yè)眾多,魔琺如何定位自身,差異性體現(xiàn)在哪里?
A:魔琺要做的是3D超寫實(shí)虛擬AIGC+X,從我們的愿景來講,希望每家企業(yè)都能有一個(gè)AIGC 3D虛擬人,這個(gè)虛擬人有形象、會(huì)表達(dá)且夠?qū)I(yè)。視頻就是“+”的一種方式,直播也是“+”,一對(duì)一互動(dòng)也是“+”,各個(gè)行業(yè)也是“+”。3D 虛擬人不是個(gè)單體,比如做視頻,不能只有 3D 虛擬人,要做綜合性的產(chǎn)品,做直播的時(shí)候也不能只有個(gè)虛擬人,做一對(duì)一交互的時(shí)候也是,核心就是通過產(chǎn)品去賦能千行百業(yè)。
值得一提的是,大概在半年以后,我們可能把3D超寫實(shí)虛擬人AIGC全棧能力開放出去,打造一個(gè)像 ChatGPT一樣的開放平臺(tái),無論C端還是B端用戶,都可以通過調(diào)用API,來使用魔琺的技術(shù)能力。
我們把魔琺定位為一家產(chǎn)品驅(qū)動(dòng)的公司,思考和做抉擇都圍繞著:技術(shù)有沒有用,能不能落地到產(chǎn)品中,產(chǎn)品能不能給用戶和客戶帶來價(jià)值等幾個(gè)關(guān)鍵性問題。
Q:您覺得3D視頻生成的難點(diǎn)有哪些?魔琺有哪些能力是Sora所不具備的?
A:最核心的難點(diǎn)是缺乏高質(zhì)量的3D數(shù)據(jù)。雖然理論上講文生圖、文生視頻的訓(xùn)練數(shù)據(jù)可以從網(wǎng)上獲得,但這跟3D訓(xùn)練數(shù)據(jù)根本不是一回事兒,即使是國內(nèi)外的動(dòng)畫公司和游戲公司所訓(xùn)練的3D內(nèi)容數(shù)據(jù)質(zhì)量也是非常差的。解決了3D數(shù)據(jù)來源的問題,才能在這基礎(chǔ)上拼算法和算力。
魔琺3D的AIGC產(chǎn)品能覆蓋到Sora不能涉及的場(chǎng)景。Sora現(xiàn)在所能呈現(xiàn)的視頻基本上全是創(chuàng)意類的視頻,當(dāng)用戶想去生成內(nèi)容信息密度高、又要求精準(zhǔn)表達(dá)的視頻時(shí),它是無法做到的,比如知識(shí)分享、發(fā)布會(huì)、教育培訓(xùn)類的場(chǎng)景。而我們所針對(duì)的恰恰是這類場(chǎng)景,在這里面,我們希望能做到準(zhǔn)確傳遞信息、精準(zhǔn)控制內(nèi)容生成、內(nèi)容可控和可編輯。
Q:針對(duì)3D數(shù)據(jù)匱乏這個(gè)難點(diǎn),魔琺是怎么解決這個(gè)問題的?
A:在過去五六年,我們一直在堅(jiān)持兩件事情,一是底層根技術(shù)的提升,以前PGC時(shí)代,你可能要找十個(gè)人,干幾個(gè)月才能做一個(gè)3D虛擬人,或者找兩三個(gè)人做幾周,才能完成場(chǎng)景的搭建,但現(xiàn)在可能幾分鐘就能實(shí)現(xiàn)。
二是3D美術(shù)質(zhì)量的提升,大家可以看我們虛擬人整體的質(zhì)量,包括場(chǎng)景、人物、美術(shù),整個(gè)都在不斷地提升。同時(shí)我們也在服務(wù)B端企業(yè)的過程中,做了很多數(shù)據(jù)的沉淀,這個(gè)數(shù)據(jù)不是說我今天一下子做的,而是在過去五六年過程中不停地積累。
Q:對(duì)于科技公司而言,前期投入成本很大,在虛擬人這個(gè)行業(yè)同樣存在這個(gè)問題,魔琺是如何理解盈利問題的?
A:對(duì)魔琺在內(nèi)的所有科技企業(yè)來說最重要的還是PMF,即能不能找到更契合市場(chǎng)的產(chǎn)品,多長時(shí)間能得到驗(yàn)證。此外就是,在這款產(chǎn)品的增長過程中,能不能實(shí)現(xiàn)規(guī)?;?。
科技跟其他所有公司屬性不一樣的點(diǎn)就是爆發(fā)力,一家科技公司的壁壘應(yīng)該很高,假如找到了市場(chǎng)契合的產(chǎn)品,后面應(yīng)該得以爆發(fā)。但是不幸的是,我們看過去十年的AI公司,即使上市也存在持續(xù)虧損的狀態(tài),原因在于其沒有找到一款爆發(fā)性的產(chǎn)品,所以沒有看到它在某一個(gè)點(diǎn),實(shí)現(xiàn)指數(shù)性的增長。但在產(chǎn)品行業(yè),爆發(fā)性增長的例子比比皆是,在國外,不一定非得是AI,ChatGPT、Canva、Figma 都是在產(chǎn)品和市場(chǎng)匹配后,實(shí)現(xiàn)了快速的增長。
魔琺的早期一直在做項(xiàng)目,這意味著在某一點(diǎn)很難去規(guī)模化,這就是為什么從兩年前開始,下定決心要做產(chǎn)品化。像我們現(xiàn)在的這款產(chǎn)品,所有的成本都是GPU的成本,C端也好,B端也好,不管有多少用戶,對(duì)我們成本都是一樣的。如果有一天我們達(dá)到了PMF,后面要做的事就是保持用戶增長即可。
Q:元宇宙時(shí)期虛擬人的造價(jià)成本非常高昂,隨著AIGC技術(shù)的落地,虛擬人成本降低了多少?
A:最早時(shí)候,企業(yè)定制形象成交價(jià)在60萬以上,落實(shí)到我們自己成本也要幾十萬。而現(xiàn)在,你能看到的企業(yè)的形象定制化虛擬人,成本已經(jīng)降至很低的價(jià)格。再往后,發(fā)展到今年的6、7月份,當(dāng)普通用戶都能用AIGC生成圖片、捏臉時(shí),我們的成本基本趨近于零。
在整個(gè)過程中,技術(shù)的進(jìn)步使得內(nèi)容生產(chǎn)變得越來越簡單,將經(jīng)歷PGC、UGC再到AIGC的發(fā)展曲線。無論是文本、圖片、視頻還是3D,AI的價(jià)值就在于使內(nèi)容制作門檻越來越低,企業(yè)成本越來越低,內(nèi)容生成質(zhì)量越來越好。
Q:您提到3D虛擬人終點(diǎn)是一個(gè)智能體,需要把最好的經(jīng)驗(yàn)去復(fù)制。那魔琺是怎么實(shí)現(xiàn)各個(gè)行業(yè)的結(jié)合和復(fù)制的?
A:虛擬人要有形象、會(huì)表達(dá)、有技能,當(dāng)把虛擬人定義成一個(gè)賺錢工具時(shí),企業(yè)在意的是ROI和轉(zhuǎn)化率。想要效果好,就需要最佳實(shí)踐。
以電商直播場(chǎng)景為例,我們虛擬人訓(xùn)練的所有聲音、動(dòng)作都找了演員去模擬。AI的方式就是復(fù)制最優(yōu)秀的,這里面包括了主播的聲音、表達(dá)方式、話術(shù)。要是深入研究,你就會(huì)發(fā)現(xiàn),主播大促,淘寶和抖音不同平臺(tái)以及不同品類的話術(shù)表達(dá)都是不同的,講品過程邏輯也是不同的。所以看似ChatGPT 也能做同樣的事情,但要和具體產(chǎn)業(yè)結(jié)合仍然需要很長的時(shí)間。
Q:Sora的升溫也讓國內(nèi)視頻生成賽道的初創(chuàng)企業(yè)受到了關(guān)注,您如何看待未來的競(jìng)爭(zhēng)格局?
A:從路徑上分化,就是剛才提到的以Sora為代表的2D視頻生成路線,和魔琺選擇的3D視頻生成路線。
一個(gè)很殘酷的事實(shí)是,在OpenAI的延長線上的公司都很危險(xiǎn)。你可以去問一些投資人,在年前Sora還沒出來的時(shí)候,盡管一些創(chuàng)業(yè)公司還在demo階段,投資人可能已經(jīng)有意向去投資,甚至部分協(xié)議都簽完了。但是,Sora一出來就全部不投了。這個(gè)事已經(jīng)證明,創(chuàng)業(yè)公司但凡在OpenAI的延長線上,都可能會(huì)面臨被顛覆的命運(yùn),現(xiàn)在的Pika、Runway在市場(chǎng)競(jìng)爭(zhēng)處境也變得很艱難。
目前Sora產(chǎn)品沒有公開,且不可編輯、時(shí)長也有限制,未來它也可以彌補(bǔ)這些不足。但到底技術(shù)迭代發(fā)展的曲線是陡峭還是平緩?還是不確定的,你今天說他很陡峭,難道他一直會(huì)很陡峭嗎?Sora這條路,我認(rèn)為如果做出來,更適合創(chuàng)意類視頻生成。
本文來自投稿,不代表增長黑客立場(chǎng),如若轉(zhuǎn)載,請(qǐng)注明出處:http://gptmaths.com/cgo/115054.html