淺談游戲行業(yè)當前的AI動畫/視頻工具

0 評論 2860 瀏覽 11 收藏 28 分鐘

自從ChatGPT和Sora發(fā)布后,在我們的工作流程中,AI能參與的部分越來越多。比如本文從游戲行業(yè)從業(yè)者的視角出發(fā),談?wù)劗斍皩τ贏I動畫/視頻的一些思考。

最近,Sora的公布給所有行業(yè)的人帶來了狠狠地Impact,所有從業(yè)者都在期待著AI動畫/視頻技術(shù)的革新,并為行業(yè)帶來的效率提升。

本文將從游戲行業(yè)從業(yè)者的視角出發(fā),談?wù)劗斍皩τ贏I動畫/視頻的一些思考。BTW,目前AI技術(shù)日新月異,本人對于某個領(lǐng)域的能力的AI技術(shù)認知可能有所滯后,歡迎指正。

一、游戲行業(yè)的美術(shù)資源

游戲行業(yè)是一個嚴重依賴美術(shù)資源的行業(yè)。無論是在游戲的研發(fā)、營銷還是運營過程中,都需要大量的美術(shù)資源。

1. 研發(fā)側(cè)

在游戲研發(fā)階段,策劃設(shè)計游戲玩法和系統(tǒng),將其交由美術(shù)團隊進行角色、界面和場景設(shè)計,最終由開發(fā)團隊完成游戲的開發(fā)和測試工作。根據(jù)游戲類型的不同,所需的美術(shù)資源也會有所差異。

美術(shù)資源主要分為:

  • 2D美術(shù)資源(如角色設(shè)計、背景設(shè)計、道具設(shè)計、UI界面設(shè)計)
  • 3D美術(shù)資源(如角色建模、場景建模、動畫設(shè)計、貼圖紋理)
  • 動畫資源(括角色動作、戰(zhàn)斗效果、場景光影以及UI交互等)

根據(jù)東方財富證券的報告,游戲研發(fā)成本占收入比約在 15%-35%,美術(shù)成本一般占到游戲研發(fā)成本的 50-70%。根據(jù)伽馬數(shù)據(jù),2023年中國游戲市場實際銷售收入3029.64億元。因此,此處美術(shù)成本約為200~800億元。

數(shù)據(jù)來源:游戲工委、伽馬數(shù)據(jù)(CNG)

2. 營銷側(cè)

在游戲開發(fā)完成后,游戲公司需要進行游戲營銷,以有限的成本吸引更多精準的用戶。常見的獲客手段包括投放廣告、聯(lián)合運營和品牌宣傳等。在營銷過程中,需要大量的營銷美術(shù)資源,如圖片、動圖和視頻,用于廣告投放、聯(lián)運商城以及品牌宣傳。比如,我們常見的洗腦廣告視頻,這些是由真人拍攝的廣告視頻。

根據(jù)游戲新知的數(shù)據(jù),營銷一直是游戲公司支出的重要部分,因此對美術(shù)資源的需求也非常高。

3. 運營側(cè)

一旦吸引用戶進入游戲,運營團隊的主要任務(wù)是促進用戶活躍、提高留存率并引導用戶進行付費轉(zhuǎn)化。在運營過程中,需要大量的美術(shù)資源,與營銷所需的素材相似,但主要用于運營活動和社群內(nèi)容構(gòu)建,包括圖片、動圖和視頻等美術(shù)素材。

綜上所述,游戲行業(yè)對美術(shù)資源的需求主要分為3類:2D美術(shù)資源、3D美術(shù)資源和動畫資源。

二、當前游戲行業(yè)美術(shù)對AI的應用

根據(jù)伽馬數(shù)據(jù)的報告顯示,自AI繪畫技術(shù)問世以來,某游戲企業(yè)在美術(shù)方面取得了顯著進展。據(jù)稱,該企業(yè)目前在美術(shù)方面的成本節(jié)省率達到40%,文案創(chuàng)作效率提升超過50%,而未來在研發(fā)端,整體成本預計將下降30%。以往需要兩周完成的2D美術(shù)資源生產(chǎn),如今僅需3天便可完成。

一個完整的2D美術(shù)資源的生產(chǎn)應該包含以下流程:

然而,由于當前AI技術(shù)的“可控性”和“穩(wěn)定性”仍有提升空間,因此AI工具主要在激發(fā)靈感、制作草稿以及需求確認等方面發(fā)揮作用。

盡管部分素材可以直接采用AI生成的成稿,但這僅適用于少數(shù)情況。美術(shù)人員可以通過文生圖/圖生圖等方式進行抽卡,激發(fā)創(chuàng)作靈感,并快速形成草稿,從而顯著提高美術(shù)資源的生產(chǎn)效率。

同時,借助已生成的草稿,可以快速與需求方進行對齊?;蛘?,需求方可以通過AI工具生成樣圖,與美術(shù)人員進行需求確認。這種方式可以大大減少由溝通問題導致的需求差異,從而減少返工情況,進一步提高美術(shù)資源的生產(chǎn)效率。

當前,雖然在3D美術(shù)資源領(lǐng)域已經(jīng)出現(xiàn)了一些能夠快速生成資源的工具,但相比之下,仍未有2D美術(shù)資源的生成成熟,然而這方面的討論將暫且擱置。在美術(shù)資源的各個類型中,AI視頻工具在動畫美術(shù)資源的制作中發(fā)揮著一定的輔助作用,盡管也存在一些挑戰(zhàn)。根據(jù)前文的分析,游戲行業(yè)中動畫素材的制作場景主要涉及以下方面:

  1. 研發(fā)側(cè):角色動作、戰(zhàn)斗效果、場景光影、UI交互等;
  2. 營銷側(cè):視頻素材、動圖素材;
  3. 運營側(cè):活動/內(nèi)容運營素材等;

所有這些方面都可以通過與AI動畫/視頻相關(guān)工具的結(jié)合來實現(xiàn)成本降低、效率提升的目標。

我們先拆解下現(xiàn)在動畫素材制作的流程,主要有以下環(huán)節(jié):

1. 尋找靈感

在進行動畫素材的制作之前,美術(shù)人員通常會利用第三方平臺進行調(diào)研,以收集靈感和素材。

對于營銷層面的視頻素材的制作靈感收集,他們使用像DataEye、AppGrowing等網(wǎng)站,這些平臺匯集了廣告領(lǐng)域中最熱門和最新的視頻素材。通過這些調(diào)研,制作者可以了解哪些素材在廣告投放中效果良好、哪些是當前熱門的素材,以及哪些具有潛力,從而指導他們的視頻素材創(chuàng)作。

然而,海量數(shù)據(jù)分析是一項耗時耗力的工作。動畫/視頻制作本身就是一個人力密集型的過程,如果還需要額外的時間用于靈感收集,那將增加額外的成本。

熱門且效果良好的素材具有明顯的數(shù)據(jù)特征,可以通過數(shù)據(jù)規(guī)則快速提取,但仍需要人工識別其中的參考內(nèi)容。而那些具有潛力的素材則往往沒有明顯的數(shù)據(jù)特征,因此只能在海量數(shù)據(jù)中進行挖掘,有些許像大海撈針。

假設(shè)我們能夠應用AI技術(shù)來增強業(yè)務(wù)能力,通過AI動畫/視頻分析,系統(tǒng)可以解構(gòu)視頻中的元素并進行標簽分類,將這些分類信息存儲在靈感庫中,以便設(shè)計師快速提取靈感,同時也有助于快速發(fā)現(xiàn)潛力內(nèi)容。通過AI技術(shù),我們可以將海量數(shù)據(jù)濃縮為高價值信息,從而提升業(yè)務(wù)生產(chǎn)效率。

目前,B站提供了AI視頻分析功能,但僅適用于部分視頻。沒有配音或字幕的視頻以及發(fā)布時間早于24年的視頻無法使用該功能。估計B站的AI視頻能力主要通過OCR和語音識別技術(shù)提取視頻文本內(nèi)容,并將其提交給LLM進行總結(jié)。

然而,游戲的動畫/視頻素材生產(chǎn),更多的是涉及沒有文本內(nèi)容的畫面(角色動作、戰(zhàn)斗效果、場景光影、UI交互、游戲?qū)崨r視頻等)。類似于B站的視頻分析能力,目前還無法從這些畫面中提取信息。這就需要依賴基于視覺內(nèi)容的AI分析模型。目前一些SaaS廠商提供了相關(guān)能力,但是要提煉出美術(shù)設(shè)計師所關(guān)心的內(nèi)容仍然具有一定難度,因此這些模型更多地用于視頻內(nèi)容審核。

圖片來源于商湯(左)和網(wǎng)易易盾(右)

2. 制作草稿

動畫素材實質(zhì)上是2D/3D美術(shù)資源在時間維度上的延續(xù),因此動畫的草稿相對復雜,涉及腳本、分鏡等設(shè)計內(nèi)容,其中的溝通成本和試錯成本遠高于2D/3D美術(shù)資源。

目前存在幾個方向的AI視頻/動畫工具,可以在制作草稿過程中發(fā)揮作用:

1)素材搜索匹配:

在調(diào)研過程中,發(fā)現(xiàn)一類AI動畫/視頻工具,通過輸入文本/圖片,AI能夠匹配相關(guān)度較高的視頻素材并進行拼接,同時使用AI聲音進行配音,快速生成相關(guān)動畫/視頻內(nèi)容。

圖中為度加創(chuàng)作工具

這類AI動畫/視頻工具的核心在于素材搜索匹配能力。

通過對素材庫中的視頻進行分析、拆解、打標簽,再根據(jù)用戶的提示詞匹配最合適的動畫/視頻內(nèi)容,從而拼接成動畫/視頻。這個過程涉及到AI文本生成、語音合成、動畫/視頻剪輯等能力,可以歸類為剪輯工具。

然而,當前這類工具可能存在以下問題:

i)素材上下文相關(guān)性:

由于視頻是由多個素材拼接而成,若AI無法理解素材之間的關(guān)系,在動畫/視頻剪輯過程中使用了矛盾的素材,將影響最終成片效果。

ii)素材版權(quán):

生成的動畫/視頻片段來源于其他視頻素材,可能涉及版權(quán)問題。工具需要解決和規(guī)避侵權(quán)內(nèi)容的識別問題。

iii)素材庫的大?。?/strong>

素材庫規(guī)模的大小直接影響這類視頻生成工具的效果和生成的視頻多樣性。龐大的素材庫需要大量版權(quán)資源或內(nèi)容平臺支持,從而構(gòu)建工具的“網(wǎng)絡(luò)效應”,而較小的素材庫會限制工具的效果。

因而,這個方向的AI工具,內(nèi)容巨頭企業(yè)才更容易做得更好。

iv)搜索匹配的準確度:

動畫/視頻分析AI對動畫/視頻內(nèi)容的理解有限,導致搜索匹配結(jié)果準確度問題,與用戶設(shè)想的畫面可能存在一定差距。在生成多個動畫/視頻片段拼接而成的視頻時,準確率問題會疊加,使成品動畫/視頻偏離原始設(shè)想。

這些問題導致素材搜索匹配相關(guān)的AI產(chǎn)品工具,在當前并不是那么好用。

2)文/圖生視頻:

Sora屬于文/圖生視頻的AI方向。在Sora發(fā)布之前,市場上已有相關(guān)工具如Pika、RunwayGen2、Stable Video Diffusion,它們可以根據(jù)用戶輸入的文本或靜態(tài)圖片,生成幾秒鐘的視頻/動畫。

然而,目前市面上的文/圖生視頻AI工具存在明顯缺陷,例如:

i)未能理解物理世界:

正如Runway之前宣布要通用世界模型(General World Model),像Gen-2這樣的視頻生成AI,僅僅是生成了具有有一定運動的短視頻,但是在處理攝像機運動或物體運動等問題上存在局限。

比如這里,我用張倆男孩打架的圖片,生成的視頻中,男孩揮出去的手反而貫穿了自己的腦袋。

雖然Sora也具備了通用世界模型的基礎(chǔ)能力,但是也同樣存在“對物理世界理解不足”的問題,比如知名的“玻璃破碎”、“虛空椅子”。這些訓練數(shù)據(jù)不足的情況,使得在多主體之間的運動無法被準確表達。

ii)主體一致性問題:

在AI生成的動畫/視頻中,人物外貌、動作等可能隨著人物動作的變化而發(fā)生變化,導致主體一致性問題,影響視頻質(zhì)量。如下圖的案例中,原本是生成馬斯克的視頻,但是在視頻的最后幾秒,馬斯克變成了一個黃種女人。

視頻素材來源于知乎用戶sunny

iii)無法生成游戲行業(yè)垂直內(nèi)容:

像是角色動作、戰(zhàn)斗效果、場景光影、UI交互、游戲?qū)崨r視頻等內(nèi)容,AI工具的生成效果極差。因此對于游戲行業(yè),大概率僅有視頻類動畫素材的生產(chǎn)過程才能用上這類AI工具。

3. 收集素材

制作視頻類動畫素材涉及收集素材的過程,其中需要結(jié)合分鏡稿,收集足夠的素材以供剪輯使用。這一過程與制作草稿的工具需求大致相同,可以借助“素材搜索匹配”和“文/圖生視頻工具”的AI能力來輔助。

4. 成稿

一旦素材齊全,下一步就是將所收集/制作的素材拼接成最終的成品稿。這個過程涉及到多種類型的AI動畫/視頻工具,種類繁多且多樣,較難一一概括,以下是我觀察到的一些類型,而且大多都只能用在視頻類型的素材剪輯上。

1)視頻拆條:

這類工具旨在快速將視頻按需求進行剪輯拆分和拼接。舉例來說,火山引擎提供了“視頻拆條”功能,利用AI畫面和語音識別自動將視頻進行拆分,同時支持對視頻進行進階設(shè)置。這種工具可用于對長視頻進行分割處理,以便進行短視頻合成。

又比如,“vidyo.ai”提供的視頻拆條能力,在基于語音識別的基礎(chǔ)上,還提供了針對不同內(nèi)容平臺的格式轉(zhuǎn)化能力。

2)配音:

語音配音在制作視頻類內(nèi)容時扮演著重要的角色。盡管在嚴格意義上,配音并不屬于AI視頻工具的范疇,但卻是制作視頻內(nèi)容不可或缺的一環(huán)。當前的AI生成語音技術(shù)已經(jīng)相當成熟,以剪映官方為例,他們提供了完善的配音音色功能,用戶可以通過輸入文本生成對應的音頻內(nèi)容。

3)字幕:

視頻制作中不可或缺的一環(huán)是字幕。隨著技術(shù)的發(fā)展,字幕生成技術(shù)也日趨成熟,例如,剪映已經(jīng)具備了自動生成字幕的能力。

4)畫面編輯:

我覺得很多視頻工具都可以歸到這一類里面,比如視頻剪輯軟件里面都會配備的濾鏡能力,通過應用特定的濾鏡效果,使視頻呈現(xiàn)出特定風格和視覺效果。

同時,市面上也有能將夠穩(wěn)定將視頻轉(zhuǎn)換成其他風格的工具,如Ebsynth。

Runway里面除了視頻生成能力,還提供了像是一鍵刪除背景、一鍵修復、一鍵模糊等效果編輯AI。

perfectly-clear提供的編輯能力可用于改善視頻的色彩、提高對比度、消除噪點、改善視頻的清晰度,以及消除視頻中的抖動和模糊。

騰訊云提供的AI換臉技術(shù)將真人視頻中的人臉替換成其他人臉。

5)數(shù)字人:

幾乎所有主要廠商都在積極探索并應用這一技術(shù)。其核心在于利用AI生成個性化的數(shù)字人物,并結(jié)合專屬的AI音色,使得這些AI數(shù)字人可以替代用戶進行視頻解說。在直播帶貨等場景中,這種技術(shù)不僅可以提高效率,還能有效節(jié)省人力成本。

四、小結(jié)

結(jié)合我的調(diào)研,目前游戲行業(yè)相關(guān)的AI視頻/動畫工具可分為4大類:

  1. 動畫/視頻分析:利用人工智能的分析和理解能力,提煉出美術(shù)設(shè)計所關(guān)注的核心信息,將大量信息壓縮成關(guān)鍵要點,從而提高尋找靈感的效率。
  2. 素材搜索匹配:基于視頻分析的AI技術(shù),通過對素材庫中的視頻進行分析、解構(gòu)和標記,再根據(jù)用戶提供的關(guān)鍵詞匹配最適合的動畫/視頻內(nèi)容,提高視頻類動畫資源制作的效率。
  3. 動畫/視頻生成:基于生成式AI技術(shù),能夠通過文本和圖像內(nèi)容生成動畫視頻內(nèi)容。
  4. 剪輯工具類:輔助動畫資源的制作,提高制作效率。

目前的AI視頻/動畫工具更多偏向于視頻類動畫素材的生產(chǎn),更適用于與營銷相關(guān)的業(yè)務(wù)生產(chǎn),因為這方面對于大型模型的定制化要求較低。然而,對于與動效相關(guān)的動畫生產(chǎn),可能需要游戲行業(yè)垂直領(lǐng)域大型模型能力的進一步發(fā)展。

我將收集到的AI視頻/動畫工具給到美術(shù)設(shè)計,他們的回答是:“好像什么都能做,但是又好像做不好的感覺??偛荒転榱诉@碗醋(使用AI),才包的這頓餃子吧(做動畫/視頻)。”剖析其中的原因,主要是:

  • 素材搜索匹配、視頻生成類當前AI工具對于游戲行業(yè)垂直程度不夠高,無法生成足夠高準度的內(nèi)容。而且動畫素材有別于圖片素材,AI圖片生成內(nèi)容的準確度不高時候,美術(shù)還可以上手修改,但是當AI視頻生成的準確度不高的時候,逐幀修改成本過高,不具有可行性。
  • 工具分散,未能較好貼合生產(chǎn)流程。大部分的AI工具分布在不同的平臺上,“收集靈感”——“制作草稿”——“收集素材”——“剪輯成稿”的過程需要跳轉(zhuǎn)的平臺過多,同時各類工具的更新和版本調(diào)整也需要人力去跟進和維護,再加上大部分工具使用場景很小,單獨購買性價比不高。整體需要耗費過多的精力和成本,這有礙于AI工具對于制作的提效。
  • 由于工具使用都是分散在各類工具平臺上,AI工具的使用不能進行AI資產(chǎn)的積累,無法形成工具使用的“邊際成本遞減”。(比如文/圖生圖的AI使用,可以通過低模型訓練、參數(shù)調(diào)試的方式,快速將AI工具變成業(yè)務(wù)的形狀,提高生產(chǎn)效率)
  • 目前收集到的大部分AI視頻/動畫工具,普遍都是需要收費的。要么按請求量收費,要么是會員制,動則每個月上百塊。結(jié)合前文提到的AI準確度不高和工具分散問題,業(yè)務(wù)可能需要在多個平臺多次“抽卡”(調(diào)侃準確度不高,就好像游戲抽卡那樣,需要N次才能出來想要的結(jié)果),這個過程大大加大了成本的消耗,使得AI的使用成本甚至可能高于人肉。

隨著越來越多AI公司的入局,以上提到的問題一定會被解決,正如萬物摩爾定律所描述,成本問題也會越來越低。Sora的出現(xiàn),無疑是對這個過程的加速。

但是我也想談?wù)勎覍ξ磥碚雇囊恍┯^點,我覺得未來的AI動畫/視頻工具一定是背靠視頻剪輯/動畫制作工具的,并集成大多數(shù)的AI工具(All in one),因為:

1.工具集成&貼合工作流帶來的用戶體驗優(yōu)勢:

視頻剪輯/動畫制作工具本身就是貼合用戶工作流程的產(chǎn)品形態(tài)。當AI工具集成在一起時,用戶可以直接利用AI能力進行生產(chǎn),無需研究各種AI工具,減少額外精力消耗。同時,基于用戶使用習慣,產(chǎn)品可以提供AI數(shù)據(jù)資產(chǎn)積累能力,定制化模型,更貼合用戶使用習慣,構(gòu)成用戶的沉沒成本。

2.用戶增長優(yōu)勢:

現(xiàn)有視頻剪輯/動畫制作工具已有一批忠實用戶群體,發(fā)展AI能力時無需從零開始用戶增長。在成熟工具上構(gòu)建AI能力,加固了產(chǎn)品壁壘。

3.更容易構(gòu)建數(shù)據(jù)飛輪,構(gòu)建數(shù)據(jù)壁壘:

借助平臺原有的用戶積累,能夠利用龐大的素材積累、數(shù)據(jù)積累訓練優(yōu)秀的大模型,打造優(yōu)質(zhì)的視頻產(chǎn)品功能,從而吸引更多用戶,構(gòu)建數(shù)據(jù)飛輪,構(gòu)建自身的壁壘。

4.工具更具有可控性問題的解決方案:

AI動畫/視頻生成工具是具有本質(zhì)上的矛盾的,文本是低維信息,卻需要準確表達動畫/視頻這種高維信息,這個過程必定伴隨信息的失真。文生視頻必定是不能100%傳達制作者的想法的。這個過程就需要編輯工具的存在,通過人工編輯的接入,將內(nèi)容準確表達。而且,通過編輯工具,我們也能通過人力彌補AI的準確度問題,使得在AI能力能準確生成我們需要的內(nèi)容之前,我們也能利用AI進行效率的提升。

因此背靠視頻剪輯/動畫制作工具,更容易進行編輯工具構(gòu)建,從而解決可控性問題。

專欄作家

檸檬餅干凈又衛(wèi)生,公眾號:檸檬餅干凈又衛(wèi)生,人人都是產(chǎn)品經(jīng)理專欄作家。一名游戲行業(yè)的B端產(chǎn)品,負責過游戲行業(yè)內(nèi)CRM 、風控、BI、SDK、AI相關(guān)的內(nèi)容,定期輸出個人思考或總結(jié)文章~

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自Unsplash,基于CC0協(xié)議

該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!