文｜郝 ?? 鑫

爆火于元宇宙，轉(zhuǎn)而銷聲匿跡，又在大模型來臨后死灰復(fù)燃，眼看著一波波創(chuàng)業(yè)公司倒在黎明前，一波波新生力量又在風(fēng)口爆發(fā)后崛起，風(fēng)險(xiǎn)與機(jī)會(huì)齊飛。

想要在曲折而不確定性的虛擬人賽道找尋發(fā)展的確定性，通過虛擬人來穿越技術(shù)和經(jīng)濟(jì)的發(fā)展周期成為一件極其困難的事情。

魔琺科技，這家從元宇宙開始到現(xiàn)在始終堅(jiān)持3D虛擬人方向的公司，用每個(gè)階段不同的技術(shù)探索以及對(duì)虛擬人的認(rèn)知更新來回答“如何穿越周期”這個(gè)問題。

不管行業(yè)如何變化，自成立至今，魔琺一直在探索3D虛擬人的生成路徑。

2018年成立初期，魔琺將構(gòu)建元宇宙的基礎(chǔ)設(shè)施為核心目標(biāo)，并提出了“虛擬+X”的概念，掌握了全棧式的虛擬內(nèi)容智能化制作技術(shù)，打造了虛擬直播和線下實(shí)時(shí)互動(dòng)產(chǎn)品以及三維AI虛擬人能力平臺(tái)。

2023年，大模型和AIGC技術(shù)讓虛擬人實(shí)現(xiàn)突破，魔琺重新定義AIGC時(shí)代的虛擬人，并發(fā)布了虛擬人直播 AIGC 平臺(tái) “ 魔琺有光”、虛擬人視頻 AIGC 平臺(tái) “ 魔琺有言 ”和虛擬人服務(wù) AIGC 平臺(tái) “ 魔琺有靈 ”，三款超寫實(shí) 3D 虛擬人產(chǎn)品。

魔琺CEO柴金祥表示：“3D虛擬人具有高質(zhì)量超寫實(shí)形象，能表達(dá)，可互動(dòng)，且是AIGC生成的”，要同時(shí)具備超寫實(shí)3D形象、生動(dòng)的表達(dá)能力和垂直領(lǐng)域的專業(yè)能力。

從更宏觀的角度，柴金祥認(rèn)為，“文生文、文生圖、文生視頻都只不過是AIGC的能力，而AIGC演進(jìn)的終極形態(tài)一定是3D虛擬人。”

2024年開年，Sora炸翻了天，令國內(nèi)的創(chuàng)業(yè)公司和投資人感到震驚和恐慌。在這樣的背景下，手握3D虛擬人AIGC視頻生成平臺(tái)且已經(jīng)開始產(chǎn)品化的魔琺，顯得格外冷靜。

柴金祥認(rèn)為，Sora的路線不一定適合中國企業(yè)，Sora走2D視頻生成路線，更適合創(chuàng)意類視頻生成；魔琺選擇走3D視頻生成路線，滿足企業(yè)對(duì)信息復(fù)雜度、精準(zhǔn)性輸出的需求。

回顧魔琺的發(fā)展，其核心能力是在3D虛擬人的核心能力上做加法，以前是3D虛擬人+元宇宙，現(xiàn)在是3D虛擬人AIGC+圖文、視頻，再加電商直播、教育、文旅等千行百業(yè)。變的是整個(gè)時(shí)代發(fā)展脈絡(luò)，不變的是核心技術(shù)能力和產(chǎn)品能力。

在與行業(yè)結(jié)合的過程中，柴金祥形成了自己對(duì)科技公司商業(yè)化的思考。他認(rèn)為，對(duì)魔琺在內(nèi)的所有科技企業(yè)來說最重要的還是PMF（Product Market Fit 產(chǎn)品市場(chǎng)匹配度），即能不能找到更契合市場(chǎng)的產(chǎn)品，多長時(shí)間能得到驗(yàn)證。此外就是，在這款產(chǎn)品的增長過程中，能不能實(shí)現(xiàn)規(guī)?；?。

柴金祥介紹，魔琺從早期做項(xiàng)目再到產(chǎn)品化就是在不斷尋找規(guī)?；耐黄泣c(diǎn)，“現(xiàn)在3D虛擬人視頻生成產(chǎn)品的成本基本是GPU的成本”，如果有一天達(dá)到了PMF，后面的任務(wù)就是持續(xù)保持用戶增長。

帶著這樣的視角，光錐智能對(duì)話魔琺創(chuàng)始人兼CEO柴金祥，深入理解魔琺穿越技術(shù)周期的思路以及對(duì)虛擬人產(chǎn)品化的實(shí)踐。

核心觀點(diǎn)如下：

1、文生視頻存在兩條路徑：一條是Sora，用大規(guī)模視頻數(shù)據(jù)訓(xùn)練大模型，生成2D視頻內(nèi)容；一條是3D內(nèi)容的AIGC，通過3D物理引擎渲染生成視頻。

2、魔琺要做的是3D超寫實(shí)虛擬AIGC+X，每家企業(yè)都能有一個(gè)AIGC 3D虛擬人，這個(gè)虛擬人有形象、會(huì)表達(dá)且夠?qū)I(yè)。

3、3D視頻生成的核心難點(diǎn)是缺乏高質(zhì)量的3D數(shù)據(jù)，其次才是算力、算法。

4、對(duì)科技企業(yè)來說最重要的還是PMF（Product Market Fit 產(chǎn)品市場(chǎng)匹配度），即能不能找到更契合市場(chǎng)的產(chǎn)品，多長時(shí)間能得到驗(yàn)證。

5、在OpenAI的延長線上的公司都很危險(xiǎn)，Sora更適合創(chuàng)意類視頻生成。

以下為對(duì)話實(shí)錄：

Q：Sora的爆火點(diǎn)燃了 AI 視頻賽道的戰(zhàn)火，Sora就是最佳路徑嗎？魔琺選擇的是哪條技術(shù)路徑？

A：文生圖片、文生視頻、文生3D從視頻的AIGC角度來說，有兩條核心路徑：一條路徑就是最近比較火的Sora路徑，它生成的是2D視頻，從互聯(lián)網(wǎng)上獲取大量的視頻數(shù)據(jù)來訓(xùn)練大模型，然后輸出生成視頻。像Pika、Runway這些美國公司以前都是走同一個(gè)路徑，只是效果做得相對(duì)較差，中國現(xiàn)在想完全照搬也不一定能學(xué)成。

還有一條路徑，就是3D內(nèi)容的AIGC，這也是魔琺現(xiàn)在選擇的道路。無論國內(nèi)外，三維內(nèi)容AIGC大家多多少少都有聽過，但是沒見過產(chǎn)品，也沒見過好的Demo，導(dǎo)致對(duì)3D內(nèi)容的AIGC其實(shí)缺乏一定的概念。

Q：什么是3D虛擬人AIGC產(chǎn)品？

A：我們定義里的3D虛擬人，我自己認(rèn)為它是一種最高級(jí)的內(nèi)容形態(tài)。意思是說，通過虛擬人可以復(fù)制無窮個(gè)自己，從而打破時(shí)間、空間的限制，也能和任意的節(jié)點(diǎn)產(chǎn)生聯(lián)系和互動(dòng)，達(dá)到一種隨時(shí)在線的狀態(tài)。我們認(rèn)為它是比圖文、比視頻更高級(jí)的形態(tài)，因?yàn)樗前阉袞|西都結(jié)合起來，本質(zhì)上是一個(gè)智能體。

我們的AIGC體現(xiàn)在哪里？視頻里人物的所有表達(dá)都是AIGC生成的，包括他的表情、眼神、手勢(shì)、動(dòng)作、聲音等等。現(xiàn)在，AIGC的功能體現(xiàn)是文本腳本生成，我們3月底的下一個(gè)版本，大家會(huì)看到把我們自己的大模型、文本大模型結(jié)合進(jìn)去，用戶直接輸入prompt 就能完成操作。

Q：虛擬人賽道的廠商和企業(yè)眾多，魔琺如何定位自身，差異性體現(xiàn)在哪里？

A：魔琺要做的是3D超寫實(shí)虛擬AIGC+X，從我們的愿景來講，希望每家企業(yè)都能有一個(gè)AIGC 3D虛擬人，這個(gè)虛擬人有形象、會(huì)表達(dá)且夠?qū)I(yè)。視頻就是“+”的一種方式，直播也是“＋”，一對(duì)一互動(dòng)也是“＋”，各個(gè)行業(yè)也是“＋”。3D 虛擬人不是個(gè)單體，比如做視頻，不能只有 3D 虛擬人，要做綜合性的產(chǎn)品，做直播的時(shí)候也不能只有個(gè)虛擬人，做一對(duì)一交互的時(shí)候也是，核心就是通過產(chǎn)品去賦能千行百業(yè)。

值得一提的是，大概在半年以后，我們可能把3D超寫實(shí)虛擬人AIGC全棧能力開放出去，打造一個(gè)像 ChatGPT一樣的開放平臺(tái)，無論C端還是B端用戶，都可以通過調(diào)用API，來使用魔琺的技術(shù)能力。

我們把魔琺定位為一家產(chǎn)品驅(qū)動(dòng)的公司，思考和做抉擇都圍繞著：技術(shù)有沒有用，能不能落地到產(chǎn)品中，產(chǎn)品能不能給用戶和客戶帶來價(jià)值等幾個(gè)關(guān)鍵性問題。

Q：您覺得3D視頻生成的難點(diǎn)有哪些？魔琺有哪些能力是Sora所不具備的？

A：最核心的難點(diǎn)是缺乏高質(zhì)量的3D數(shù)據(jù)。雖然理論上講文生圖、文生視頻的訓(xùn)練數(shù)據(jù)可以從網(wǎng)上獲得，但這跟3D訓(xùn)練數(shù)據(jù)根本不是一回事兒，即使是國內(nèi)外的動(dòng)畫公司和游戲公司所訓(xùn)練的3D內(nèi)容數(shù)據(jù)質(zhì)量也是非常差的。解決了3D數(shù)據(jù)來源的問題，才能在這基礎(chǔ)上拼算法和算力。

魔琺3D的AIGC產(chǎn)品能覆蓋到Sora不能涉及的場(chǎng)景。Sora現(xiàn)在所能呈現(xiàn)的視頻基本上全是創(chuàng)意類的視頻，當(dāng)用戶想去生成內(nèi)容信息密度高、又要求精準(zhǔn)表達(dá)的視頻時(shí)，它是無法做到的，比如知識(shí)分享、發(fā)布會(huì)、教育培訓(xùn)類的場(chǎng)景。而我們所針對(duì)的恰恰是這類場(chǎng)景，在這里面，我們希望能做到準(zhǔn)確傳遞信息、精準(zhǔn)控制內(nèi)容生成、內(nèi)容可控和可編輯。

Q:針對(duì)3D數(shù)據(jù)匱乏這個(gè)難點(diǎn)，魔琺是怎么解決這個(gè)問題的？

A：在過去五六年，我們一直在堅(jiān)持兩件事情，一是底層根技術(shù)的提升，以前PGC時(shí)代，你可能要找十個(gè)人，干幾個(gè)月才能做一個(gè)3D虛擬人，或者找兩三個(gè)人做幾周，才能完成場(chǎng)景的搭建，但現(xiàn)在可能幾分鐘就能實(shí)現(xiàn)。

二是3D美術(shù)質(zhì)量的提升，大家可以看我們虛擬人整體的質(zhì)量，包括場(chǎng)景、人物、美術(shù)，整個(gè)都在不斷地提升。同時(shí)我們也在服務(wù)B端企業(yè)的過程中，做了很多數(shù)據(jù)的沉淀，這個(gè)數(shù)據(jù)不是說我今天一下子做的，而是在過去五六年過程中不停地積累。

Q：對(duì)于科技公司而言，前期投入成本很大，在虛擬人這個(gè)行業(yè)同樣存在這個(gè)問題，魔琺是如何理解盈利問題的？

A：對(duì)魔琺在內(nèi)的所有科技企業(yè)來說最重要的還是PMF，即能不能找到更契合市場(chǎng)的產(chǎn)品，多長時(shí)間能得到驗(yàn)證。此外就是，在這款產(chǎn)品的增長過程中，能不能實(shí)現(xiàn)規(guī)?；?。

科技跟其他所有公司屬性不一樣的點(diǎn)就是爆發(fā)力，一家科技公司的壁壘應(yīng)該很高，假如找到了市場(chǎng)契合的產(chǎn)品，后面應(yīng)該得以爆發(fā)。但是不幸的是，我們看過去十年的AI公司，即使上市也存在持續(xù)虧損的狀態(tài)，原因在于其沒有找到一款爆發(fā)性的產(chǎn)品，所以沒有看到它在某一個(gè)點(diǎn)，實(shí)現(xiàn)指數(shù)性的增長。但在產(chǎn)品行業(yè)，爆發(fā)性增長的例子比比皆是，在國外，不一定非得是AI，ChatGPT、Canva、Figma 都是在產(chǎn)品和市場(chǎng)匹配后，實(shí)現(xiàn)了快速的增長。

魔琺的早期一直在做項(xiàng)目，這意味著在某一點(diǎn)很難去規(guī)模化，這就是為什么從兩年前開始，下定決心要做產(chǎn)品化。像我們現(xiàn)在的這款產(chǎn)品，所有的成本都是GPU的成本，C端也好，B端也好，不管有多少用戶，對(duì)我們成本都是一樣的。如果有一天我們達(dá)到了PMF，后面要做的事就是保持用戶增長即可。

Q：元宇宙時(shí)期虛擬人的造價(jià)成本非常高昂，隨著AIGC技術(shù)的落地，虛擬人成本降低了多少？

A：最早時(shí)候，企業(yè)定制形象成交價(jià)在60萬以上，落實(shí)到我們自己成本也要幾十萬。而現(xiàn)在，你能看到的企業(yè)的形象定制化虛擬人，成本已經(jīng)降至很低的價(jià)格。再往后，發(fā)展到今年的6、7月份，當(dāng)普通用戶都能用AIGC生成圖片、捏臉時(shí)，我們的成本基本趨近于零。

在整個(gè)過程中，技術(shù)的進(jìn)步使得內(nèi)容生產(chǎn)變得越來越簡單，將經(jīng)歷PGC、UGC再到AIGC的發(fā)展曲線。無論是文本、圖片、視頻還是3D，AI的價(jià)值就在于使內(nèi)容制作門檻越來越低，企業(yè)成本越來越低，內(nèi)容生成質(zhì)量越來越好。

Q：您提到3D虛擬人終點(diǎn)是一個(gè)智能體，需要把最好的經(jīng)驗(yàn)去復(fù)制。那魔琺是怎么實(shí)現(xiàn)各個(gè)行業(yè)的結(jié)合和復(fù)制的？

A：虛擬人要有形象、會(huì)表達(dá)、有技能，當(dāng)把虛擬人定義成一個(gè)賺錢工具時(shí)，企業(yè)在意的是ROI和轉(zhuǎn)化率。想要效果好，就需要最佳實(shí)踐。

以電商直播場(chǎng)景為例，我們虛擬人訓(xùn)練的所有聲音、動(dòng)作都找了演員去模擬。AI的方式就是復(fù)制最優(yōu)秀的，這里面包括了主播的聲音、表達(dá)方式、話術(shù)。要是深入研究，你就會(huì)發(fā)現(xiàn)，主播大促，淘寶和抖音不同平臺(tái)以及不同品類的話術(shù)表達(dá)都是不同的，講品過程邏輯也是不同的。所以看似ChatGPT 也能做同樣的事情，但要和具體產(chǎn)業(yè)結(jié)合仍然需要很長的時(shí)間。

Q：Sora的升溫也讓國內(nèi)視頻生成賽道的初創(chuàng)企業(yè)受到了關(guān)注，您如何看待未來的競(jìng)爭(zhēng)格局？

A：從路徑上分化，就是剛才提到的以Sora為代表的2D視頻生成路線，和魔琺選擇的3D視頻生成路線。

一個(gè)很殘酷的事實(shí)是，在OpenAI的延長線上的公司都很危險(xiǎn)。你可以去問一些投資人，在年前Sora還沒出來的時(shí)候，盡管一些創(chuàng)業(yè)公司還在demo階段，投資人可能已經(jīng)有意向去投資，甚至部分協(xié)議都簽完了。但是，Sora一出來就全部不投了。這個(gè)事已經(jīng)證明，創(chuàng)業(yè)公司但凡在OpenAI的延長線上，都可能會(huì)面臨被顛覆的命運(yùn)，現(xiàn)在的Pika、Runway在市場(chǎng)競(jìng)爭(zhēng)處境也變得很艱難。

目前Sora產(chǎn)品沒有公開，且不可編輯、時(shí)長也有限制，未來它也可以彌補(bǔ)這些不足。但到底技術(shù)迭代發(fā)展的曲線是陡峭還是平緩？還是不確定的，你今天說他很陡峭，難道他一直會(huì)很陡峭嗎？Sora這條路，我認(rèn)為如果做出來，更適合創(chuàng)意類視頻生成。

本文來自投稿，不代表增長黑客立場(chǎng)，如若轉(zhuǎn)載，請(qǐng)注明出處：http://gptmaths.com/cgo/115054.html

Sora之后，視頻生成公司如何生存？| 對(duì)話魔琺創(chuàng)始人柴金祥

以下為對(duì)話實(shí)錄：

關(guān)于作者

光錐智能

發(fā)表回復(fù)

Sora之后，視頻生成公司如何生存？| 對(duì)話魔琺創(chuàng)始人柴金祥

以下為對(duì)話實(shí)錄：

關(guān)于作者

光錐智能

增長黑客Growthhk.cn薦讀更多>>

楊不壞：讓新品被談?wù)?

白石互動(dòng)丨不靠價(jià)格戰(zhàn)，老百貨如何通過“小”福利撬動(dòng)“大”增長。

為什么年輕人不愛三亞了

好”風(fēng)”好”水””健康廚房”，助力A.O.史密斯領(lǐng)跑2023中國廚衛(wèi)產(chǎn)業(yè)創(chuàng)新峰會(huì)

VERTU亞太區(qū)CEO馬琳：從科技到人文，VERTU在AI時(shí)代的新答卷

為了洗剪吹自由，年輕人把自己逼成“Tony”

發(fā)表回復(fù)

Sora之后，視頻生成公司如何生存？| 對(duì)話魔琺創(chuàng)始人柴金祥

白石互動(dòng)丨不靠價(jià)格戰(zhàn)，老百貨如何通過“小”福利撬動(dòng)“大”增長。

好”風(fēng)”好”水””健康廚房”，助力A.O.史密斯領(lǐng)跑2023中國廚衛(wèi)產(chǎn)業(yè)創(chuàng)新峰會(huì)

VERTU亞太區(qū)CEO馬琳：從科技到人文，VERTU在AI時(shí)代的新答卷

為了洗剪吹自由，年輕人把自己逼成“Tony”