AIGC在視頻生成領(lǐng)域究竟有多大的想象空間?

只A不I
0 評(píng)論 3410 瀏覽 3 收藏 6 分鐘
🔗 产品经理在不同的职业阶段,需要侧重不同的方面,从基础技能、业务深度、专业领域到战略规划和管理能力。

AI技術(shù)正在視頻內(nèi)容生成領(lǐng)域發(fā)揮著越來(lái)越大的作用,那么當(dāng)下,各家產(chǎn)品們的AI視頻生成能力表現(xiàn)得如何?AIGC在視頻生成領(lǐng)域的發(fā)展,未來(lái)又有著怎樣的想象空間?一起來(lái)看本文的分享。

AIGC在視頻內(nèi)容生成的賽道上才剛剛起步。

上周二Stable Video Diffusion(SVD)模型的發(fā)布在行業(yè)內(nèi)引起熱議,SVD模型主要提供圖片生成視頻能力。在短視頻的時(shí)代,誰(shuí)能不對(duì)智能視頻內(nèi)容生成能力感到興奮呢?那AI視頻生成能力現(xiàn)在如何能為我們所用,未來(lái)會(huì)有多大的想象空間呢?

從產(chǎn)品類型區(qū)分,AIGC視頻生成產(chǎn)品可以分為:

  1. 數(shù)字人合成視頻:以數(shù)字人搭配對(duì)話的形式為視頻內(nèi)容主題,數(shù)字人可以為個(gè)人真實(shí)形象或者是虛擬人物形象;
  2. 圖文生成視頻:通過(guò)輸入圖片搭配文字描述生成以圖片內(nèi)容為主題的擴(kuò)展視頻;
  3. 素材合成:通過(guò)文字描述,在素材庫(kù)或網(wǎng)絡(luò)中檢索匹配的視頻或者圖片內(nèi)容,組合成一部視頻。

一、數(shù)字人合成視頻

通過(guò)個(gè)人形象+動(dòng)作+聲音合成視頻,視頻內(nèi)的相關(guān)元素均可通過(guò)視頻錄制上傳后制作成為模板。適用于視頻內(nèi)容相對(duì)固定,視頻形式以真人+講解的場(chǎng)景,例如廣告宣傳、知識(shí)講解等。

以下是通過(guò)HeyGen生成的視頻片段,兩個(gè)形象均為數(shù)字虛擬人,從產(chǎn)品效果看,數(shù)字人的形象、動(dòng)作、音色的還原度均非常高。

前陣子非?;馃岬耐庹Z(yǔ)對(duì)嘴型視頻也可以通過(guò)HeyGen進(jìn)行制作,只要上傳視頻并選擇需要翻譯的語(yǔ)言,就可以將原視頻音頻的語(yǔ)言翻譯為指定的另一門語(yǔ)言,并將視頻中人物發(fā)音的嘴型對(duì)應(yīng)上。

二、圖文生成視頻

通過(guò)圖片+文字描述生成視頻。由于文字控制的自由度過(guò)高,隨著視頻時(shí)間的增加,視頻內(nèi)容的質(zhì)量目前很難保證(且隨著AI模型對(duì)視頻內(nèi)容記憶的增加,視頻生成將消耗大量的硬件資源),目前適用于制作5秒以內(nèi)的短視頻(動(dòng)態(tài)圖),作為靜態(tài)圖片的延展。

但人類對(duì)于AI的幻想從來(lái)都不會(huì)局限在僅僅幾秒的時(shí)間內(nèi)。Runway在8月推出了Watch功能,展示了分鐘級(jí)別的作品,目前已有60多個(gè)作品。雖然中長(zhǎng)視頻制作的功能暫未開(kāi)放,但已有的作品為我們展示了AI在未來(lái)的可想象性。

以下視頻是Runway的Watch功能里片段,除了人物鏡頭拉遠(yuǎn)后身體細(xì)節(jié)會(huì)出現(xiàn)一些扭曲外,視頻整體的質(zhì)量已經(jīng)相當(dāng)不錯(cuò)。

三、素材合成

通過(guò)文字描述在已有的素材庫(kù)中選擇合適的視頻及圖片素材進(jìn)行匹配,文字描述將作為字幕展示,再選擇音色對(duì)字幕進(jìn)行配音。這種應(yīng)用方式從視頻的角度是生成,而從素材的角度更多是進(jìn)行合成。由于素材是從已有素材庫(kù)提取,故視頻質(zhì)量相對(duì)可控。適用于素材較多的視頻制作場(chǎng)景。

以下是通過(guò)剪映文字成片功能制作的視頻片段,視頻內(nèi)容整體的流暢度與文字描述關(guān)聯(lián)較大,但有部分素材與文字描述不符,受限于素材庫(kù)的素材量。

四、未來(lái)展望

從目前的產(chǎn)品形態(tài)以及生成質(zhì)量上看,AIGC在視頻生成領(lǐng)域的發(fā)展,還遠(yuǎn)未達(dá)到批量消費(fèi)級(jí)內(nèi)容生產(chǎn)的階段。受限于機(jī)器資源、內(nèi)容豐富度、使用場(chǎng)景等因素,視頻生成能力還需要經(jīng)過(guò)很長(zhǎng)時(shí)間的打磨。

在未來(lái),集成了三類視頻生成能力的工具可能會(huì)推動(dòng)AI生成視頻走向消費(fèi)級(jí)別。我們可以先定義好人物形象、聲音、動(dòng)作,再?gòu)乃夭膸?kù)檢索并添加已有的素材,最后根據(jù)文字描述決定故事情節(jié)的走向?;蛟S有一天,所有人都可以成為一名AI電影導(dǎo)演。

本文由 @只A不I 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自Unsplash,基于 CC0 協(xié)議

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!
专题
13635人已学习15篇文章
深度学习(Deep learning)是一种机器学习的分支,它是通过构建多层神经网络来实现自主学习和预测的能力。本专题的文章分享了解读深度学习。
专题
15931人已学习13篇文章
B端运营应该是产品商业化的最终结果。本专题的文章作者结合自身B端运营经验,进行B端实操项目方法论分享。
专题
16834人已学习12篇文章
分销是互联网拉人头和推广的常用手段,能够在短时间内实现裂变营销。本专题的文章分享了分销体系设计指南。
专题
19755人已学习18篇文章
物流仓储系统是实现物流高效运转的基础。本专题的文章提供了物流仓储系统设计指南。
专题
14824人已学习12篇文章
本专题的文章分享了SaaS平台产品架构设计。
专题
15340人已学习12篇文章
服务设计在流程性和系统性的问题解决方面提供很好的思路和方法。本专题的文章分享了如何做好服务设计。