從妙鴨爆火到老片修復(fù),大模型已經(jīng)開(kāi)始干活了

走出“實(shí)驗(yàn)室”

撰文 | 文燁豪  

編輯 | 王   潘

自AIGC熱潮涌現(xiàn)以來(lái),敏銳的科技巨頭們紛紛下場(chǎng),推動(dòng)著國(guó)內(nèi)大模型賽道一路狂奔。

然而,技術(shù)本身很難直接創(chuàng)造價(jià)值,訓(xùn)練大模型只是一個(gè)起點(diǎn),沸沸揚(yáng)揚(yáng)的“百模大戰(zhàn)”,也或多或少夾雜了一絲“重復(fù)制造輪子”的意味。

對(duì)大模型而言,嵌入應(yīng)用場(chǎng)景,從而實(shí)現(xiàn)成熟的商業(yè)化落地,才是終點(diǎn)所在——而隨著大模型賽道的邏輯從訓(xùn)練轉(zhuǎn)向落地,AIGC應(yīng)用正逐漸在各個(gè)領(lǐng)域涌現(xiàn)。

7月,AI寫(xiě)真應(yīng)用妙鴨相機(jī)爆火出圈,不僅在社交平臺(tái)里瘋狂刷屏,更是激起了科技語(yǔ)境的廣泛討論。很多此前不太熟悉科技語(yǔ)境的用戶,也從中第一次真切地感受到AIGC的魅力。

8月,抖音及火山引擎發(fā)起了“經(jīng)典影像修復(fù)計(jì)劃”,首次將AIGC視覺(jué)大模型應(yīng)用于老片修復(fù)場(chǎng)景,計(jì)劃修復(fù)100部香港老電影,還原大眾記憶中的香港電影,最初的、最清晰的模樣。

從妙鴨爆火到老片修復(fù),大模型已經(jīng)開(kāi)始干活了

左圖為修復(fù)前,右圖為修復(fù)后

這意味著,大模型已逐漸走出了“實(shí)驗(yàn)室”,走入人們的視野。

妙鴨相機(jī)與老片修復(fù),藏著大模型的答案

妙鴨相機(jī)的爆火,對(duì)當(dāng)下仍困于落地的大模型賽道無(wú)疑有著啟示作用。

其實(shí),從技術(shù)路徑來(lái)看,妙鴨相機(jī)背后的AIGC圖像生成能力,并沒(méi)有太高的技術(shù)壁壘,亦不及Midjourney、Stable Diffusion等主流應(yīng)用全面。

只是,諸如Midjourney等應(yīng)用有著極高的上手門(mén)檻,需要用戶不斷摸索提示詞(Prompt),在此過(guò)程中難免產(chǎn)生消費(fèi)障礙。

而妙鴨相機(jī)則將前述繁瑣的步驟封裝、簡(jiǎn)化為一鍵操作,用戶僅需上傳一張正面半身照,以及不少于20張的補(bǔ)充照,便能根據(jù)設(shè)定模板一鍵生成各式各樣的寫(xiě)真,易用性大幅提高。

從中不難窺見(jiàn),前沿技術(shù)若想實(shí)現(xiàn)大規(guī)模落地,不僅需要找準(zhǔn)應(yīng)用場(chǎng)景,更需解決相應(yīng)場(chǎng)景過(guò)往的痛點(diǎn)與難點(diǎn)。這正是火山引擎切入“老片修復(fù)”場(chǎng)景的重要原因。

一直以來(lái),老片修復(fù)都是影像領(lǐng)域的重要議題,根據(jù)來(lái)自65個(gè)國(guó)家超過(guò)130電影資料館統(tǒng)計(jì),電影自誕生以來(lái)平均存活率不過(guò) 10%。

背后的邏輯在于,早期電影拍攝后大都儲(chǔ)存于膠片上,可膠片作為儲(chǔ)存介質(zhì)可謂相當(dāng)脆弱,不僅對(duì)儲(chǔ)存環(huán)境的溫度、濕度要求極高,亦極易在使用、搬運(yùn)等過(guò)程遭受物理和化學(xué)損傷,從而產(chǎn)生褪色、撕裂、臟點(diǎn)、霉變、酸變等問(wèn)題。

一個(gè)簡(jiǎn)單的例子,如今許多早期電影的畫(huà)面色調(diào)常常偏紅或偏紫,除卻導(dǎo)演本身藝術(shù)表達(dá)的因素,更多是電影膠片因保存不當(dāng)而患上醋酸綜合征的表現(xiàn)——膠片褪色變紅的同時(shí),還會(huì)釋放出刺鼻的酸味,加劇保存環(huán)境的惡化。而酸化一旦開(kāi)始,便很難完全逆轉(zhuǎn)。

此外,電影在制作、分發(fā)過(guò)程中,膠片往往會(huì)經(jīng)歷反復(fù)翻印,每次翻印都會(huì)帶來(lái)細(xì)微的畫(huà)面細(xì)節(jié)損失,而隨著翻印次數(shù)增加,畫(huà)質(zhì)衰減將愈發(fā)嚴(yán)重?;诜N種因素,多數(shù)港片的畫(huà)面表現(xiàn)遠(yuǎn)不及當(dāng)下的高清視頻,用戶的觀影體驗(yàn)難言友好。

另一方面,傳統(tǒng)修復(fù)技術(shù)主要仰仗于人工進(jìn)行——先將膠片轉(zhuǎn)制為數(shù)字格式,再由修復(fù)師一幀一幀地處理畫(huà)面上的霉斑、污漬等問(wèn)題。

然而,一部電影通常包含數(shù)十萬(wàn)幀畫(huà)面。若完全依賴人工修復(fù),不僅成本高昂,效率也難以令人滿意。以《東邪西毒》為例,王家衛(wèi)曾回憶道,因?yàn)槟z片受潮,當(dāng)時(shí)的修復(fù)耗費(fèi)了整整四年時(shí)間。盡管如此,還是因?yàn)樾迯?fù)不及時(shí),使《東邪西毒終極版》的極少數(shù)片段仍有花片的情況出現(xiàn)。

從妙鴨爆火到老片修復(fù),大模型已經(jīng)開(kāi)始干活了

換言之,傳統(tǒng)影像修復(fù)技術(shù),難以進(jìn)行大規(guī)模修復(fù)。而若無(wú)法實(shí)現(xiàn)規(guī)?;娪百Y料館修復(fù)膠片的效率,或許難以追趕數(shù)十萬(wàn)卷膠片在時(shí)光荏苒下逐漸褪色的速度。

在此背景下,AIGC視覺(jué)大模型,成為了影視領(lǐng)域老片修復(fù)“心病”的解藥。

火山引擎的大模型答卷

利用AI深度學(xué)習(xí)算法修復(fù)影像,其實(shí)并不是什么新鮮事。早在幾年前,國(guó)內(nèi)影像垂直論壇上,便已有影像發(fā)燒友通過(guò)深度學(xué)習(xí)算法提升老片分辨率,以提升畫(huà)面觀感。

然而,過(guò)去的影像處理算法雖能在一定程度上起到提升畫(huà)質(zhì)的作用,但并不足以支撐嚴(yán)肅的商業(yè)應(yīng)用場(chǎng)景,以現(xiàn)階段基于Stable Diffusion的開(kāi)源大模型為例,其主要針對(duì)圖片生成任務(wù),對(duì)偏向于退化修復(fù)的老片修復(fù)場(chǎng)景的針對(duì)性較差,很難簡(jiǎn)單套用。

基于此,火山引擎在現(xiàn)有成熟大模型的基礎(chǔ)上,疊加了自身的老片修復(fù)網(wǎng)絡(luò),對(duì)模糊、失焦、人像、色彩等常見(jiàn)修復(fù)問(wèn)題進(jìn)行了針對(duì)性優(yōu)化,使得大模型可以充分感知和適應(yīng)老片場(chǎng)景。

一個(gè)簡(jiǎn)單的例子,傳遞角色的情感狀態(tài)和內(nèi)心世界的人像鏡頭,在電影語(yǔ)言中尤為重要。對(duì)此,火山引擎針對(duì)不同畫(huà)面質(zhì)量的影片,自適應(yīng)使用了不同人像解決方案。

針對(duì)制作時(shí)間久遠(yuǎn),影片畫(huà)質(zhì)較差的老電影,火山引擎使用基于生成式的人像修復(fù)模塊,在保持人像真實(shí)特征的前提下,進(jìn)行高清五官重建;針對(duì)中高質(zhì)量的人像,火山引擎則使用了人像超清模塊,優(yōu)化五官清晰度,實(shí)現(xiàn)了對(duì)睫毛、眉毛、發(fā)絲和膚質(zhì)等臉部細(xì)節(jié)最大程度地還原和紋理增強(qiáng)。

值得一提的是,除了面向泛化老片修復(fù)場(chǎng)景的調(diào)優(yōu),火山引擎此次更是針對(duì)港片的特性,打磨出了更垂直細(xì)分的修復(fù)能力。

以武打場(chǎng)景為例,不同于海外電影“直截了當(dāng)”的打斗,打戲作為貫穿香港電影黃金年代的獨(dú)特標(biāo)志,更像是華麗的舞蹈,強(qiáng)調(diào)每一招每一式的對(duì)壘,有著極強(qiáng)的辨識(shí)度。

可武打場(chǎng)景,對(duì)AIGC模型而言卻是不小的考驗(yàn)。一方面,畫(huà)面中迅速變化的動(dòng)作和快速運(yùn)動(dòng),往往會(huì)造成較大的幀間位移,進(jìn)而導(dǎo)致光流模型的準(zhǔn)確性下降,從而產(chǎn)生拖影;另一方面,復(fù)雜的武打動(dòng)作更容易導(dǎo)致插幀結(jié)果的失真,產(chǎn)生偽影,直接影響了觀眾的視覺(jué)體驗(yàn)。

為此,火山引擎自研了智能插幀算法,通過(guò)對(duì)前后幀的內(nèi)容進(jìn)行光流估計(jì),根據(jù)光流信息將前后幀像素轉(zhuǎn)換到中間幀,然后進(jìn)行整合,生成中間幀,提升視頻幀率;通過(guò)針對(duì)性優(yōu)化,降低處理大運(yùn)動(dòng)時(shí)的計(jì)算負(fù)擔(dān),從而提升模型的穩(wěn)定性和效果。

而武俠元素,向來(lái)是香港電影的重要組成部分,但由于早期電影拍攝制作方式較為簡(jiǎn)陋,部分武打場(chǎng)面往往會(huì)有威亞的部分殘留,從而破壞了畫(huà)面的完整性。對(duì)此,火山引擎利用去噪點(diǎn)和去劃痕等算法批量處理畫(huà)面瑕疵的同時(shí),亦針對(duì)威亞優(yōu)化了去劃痕算法,在消除威亞痕跡的同時(shí)保證了畫(huà)面主體人物的完整性。

從妙鴨爆火到老片修復(fù),大模型已經(jīng)開(kāi)始干活了

左圖為修復(fù)前,右圖為修復(fù)后

據(jù)中國(guó)電影資料館副館長(zhǎng)張小光介紹,此次電影修復(fù)也邀請(qǐng)了電影的主創(chuàng)人員參與到修復(fù)流程中,既通過(guò)技術(shù)還原影像的“形態(tài)”,亦還原影片原本的“靈魂”,使其“修舊如舊”。

背后的邏輯在于,電影修復(fù)并不僅是前沿技術(shù)的找尋落地場(chǎng)景的嘗試,更是一種商業(yè)行為。而“修舊如舊”,正是經(jīng)典電影觸動(dòng)大眾情懷、喚醒集體記憶,從而提升商業(yè)化價(jià)值的關(guān)鍵。從中不難窺見(jiàn),火山引擎務(wù)實(shí)的技術(shù)觀。

飛入尋常百姓家

盡管AIGC初期爆發(fā)初期,互聯(lián)網(wǎng)語(yǔ)境曾困于技術(shù)與應(yīng)用的激烈爭(zhēng)論,但妙鴨相機(jī)與火山引擎卻證明了,二者其實(shí)并不對(duì)立。

一方面,前沿技術(shù)的演化不斷擴(kuò)展著應(yīng)用的邊界,既使普羅大眾無(wú)需負(fù)擔(dān)寫(xiě)真館高昂的價(jià)格,便能看到自己的多元面貌;也使昔日陳舊的影像擺脫了生存危機(jī),穿越時(shí)空煥發(fā)了新的生命力。

另一方面,前沿技術(shù)從研發(fā)到落地往往需要經(jīng)歷較長(zhǎng)的周期,過(guò)去更多活在“實(shí)驗(yàn)室”里、商業(yè)化遇冷的大模型,更是需要這些深入人心的內(nèi)容來(lái)賦予它們生命,以此真正走入人們的生活。

面對(duì)前沿技術(shù)落地的桎梏,玩家們不斷交出的答卷,對(duì)行業(yè)無(wú)疑有著重要的參考價(jià)值。

出圈的妙鴨相機(jī),一改過(guò)去前沿技術(shù)落地“苦大仇深”的面貌,通過(guò)貼近普通用戶的場(chǎng)景與更易上手的功能,以更活潑、輕快的姿態(tài)切入了C端市場(chǎng)。

無(wú)獨(dú)有偶,火山引擎亦在不斷探索落地場(chǎng)景。早在2021年,火山引擎便基于畫(huà)質(zhì)增強(qiáng)技術(shù),將哪吒、葫蘆娃、黑貓警長(zhǎng)等童年記憶中的經(jīng)典動(dòng)畫(huà)修復(fù)為4K版本;去年,其則是使Beyond樂(lè)隊(duì)在紅磡體育館的演唱會(huì),時(shí)隔30多年于大眾視野中重現(xiàn)。

換言之,從還原經(jīng)典動(dòng)畫(huà),到演唱會(huì)重映,再到港片修復(fù),有如一個(gè)個(gè)錨點(diǎn),昭示著火山引擎在商業(yè)化應(yīng)用領(lǐng)域的落地生根。時(shí)至今日,火山引擎已打磨出不俗的技術(shù)力,并已在內(nèi)部業(yè)務(wù)線以及外部企服市場(chǎng),實(shí)現(xiàn)了規(guī)?;瘜?shí)踐與批量規(guī)模化生產(chǎn)應(yīng)用。

歸根結(jié)底,妙鴨相機(jī)也好,火山引擎也罷,均在通過(guò)更多元、靈活的應(yīng)用,解構(gòu)了AIGC的科技高墻,使活在科技語(yǔ)境里的前沿技術(shù),演變?yōu)榱擞脩粲|手可及的現(xiàn)實(shí)??梢灶A(yù)見(jiàn),在這批務(wù)實(shí)派玩家的帶動(dòng)下,AIGC未來(lái)或?qū)⒁愿S富的形態(tài),飛入尋常百姓家。

本文來(lái)自投稿,不代表增長(zhǎng)黑客立場(chǎng),如若轉(zhuǎn)載,請(qǐng)注明出處:http://gptmaths.com/quan/103699.html

(1)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
上一篇 2023-08-17 18:56
下一篇 2023-08-18 09:55

增長(zhǎng)黑客Growthhk.cn薦讀更多>>

發(fā)表回復(fù)

登錄后才能評(píng)論