2018手机在线看片,亚洲成综合人在线播放

搜索

APP

起點課堂會員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會特權(quán)

個人IP打造特權(quán)

30+門專項技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導(dǎo)直播

12場專業(yè)技能直播

會員專屬社群

榮耀標(biāo)識

開通會員

發(fā)布

注冊 | 登錄

AI視頻生成的場景痛點及產(chǎn)品功能設(shè)想（7000字）

黃釗hanniman

2024-10-25

1 評論 2517 瀏覽 9 收藏

🔗 产品经理的核心价值是能够准确发现和满足用户需求，把用户需求转化为产品功能，并协调资源推动落地，创造商业价值

本文深入探討了AI視頻生成技術(shù)在不同用戶群體中的應(yīng)用場景、痛點需求，以及產(chǎn)品功能的未來設(shè)想。文章從C端普通用戶、C端專業(yè)用戶和B端用戶三個角度出發(fā)，詳細(xì)分析了他們的核心需求，并提出了一系列創(chuàng)新的產(chǎn)品功能構(gòu)想。

本文分四個部分：

核心用戶畫像、場景及痛點需求分析
（重點）視頻生成產(chǎn)品的功能形態(tài)設(shè)想：從C端普通用戶、C端專業(yè)用戶及B端用戶（以電商廣告為例）三方面，分別闡述P0和P1級功能思考
視頻生成產(chǎn)品中，AI產(chǎn)品經(jīng)理的價值及核心工作是什么
“廣告營銷類”AI視頻生成產(chǎn)品mapping匯總（含優(yōu)劣勢分析及優(yōu)秀視頻案例捕捉）

核心觀點包括：

激發(fā)AI視頻長期需求：目標(biāo)用戶應(yīng)關(guān)注原本不拍、不剪視頻的普通大眾。在短劇、生活記錄類視頻的基礎(chǔ)上，利用AI制作動效，可能是AI視頻的長期需求。
Tob廣告營銷類視頻：包含視頻素材生成、端到端視頻生成兩類，重點在于設(shè)計好Agent工作流，并針對不同產(chǎn)品品類訓(xùn)練、調(diào)優(yōu)模型。
優(yōu)先將常用功能做出差異：先開發(fā)、優(yōu)化常用功能，做出差異化亮點（如對口型、人物一致性），再融入其他功能，最終覆蓋完整視頻創(chuàng)作流程。
AI視頻新奇玩法模塊化：封裝AI視頻新奇玩法為單個功能，如老照片動效功能、續(xù)寫梗圖劇情功能。用Agent工作流來增加視頻成功的概率，并在功能上增加用戶引導(dǎo)。

一、視頻生成產(chǎn)品的用戶、使用場景及需求

1.1 C端用戶

普通用戶

低制作門檻：無專業(yè)剪輯知識，也不愿花大量時間成本學(xué)。

滿足獵奇心理：制作趣味視頻（如老照片動效），分享給家人、朋友。

專業(yè)視頻制作師

創(chuàng)意需要：對視頻質(zhì)量有較高要求，希望AI能激發(fā)創(chuàng)意。

提效需求：交付有截止日期，希望AI能在保證質(zhì)量的前提下，加速視頻制作。

合規(guī)性和版權(quán)問題：廣告視頻需遵守嚴(yán)格的合規(guī)要求，特別是素材版權(quán)問題。

1.2 B端用戶（以電商廣告用戶為例）

用戶畫像：理解業(yè)務(wù)需求，清楚需要的內(nèi)容樣式。但不擅長制作精美的視頻，核心關(guān)注視頻的轉(zhuǎn)化效果。

用戶需求：

B 端产品经理如何快速成长？

产品与业务架构主要是将整个业务工作流进行分层，梳理，然后抽象出一个个需求，将业务需求与产品合情合理的映射起来，最终使业务数据在产品中流动，执行，记录，使用。

查看详情 >

預(yù)算限制：傳統(tǒng)視頻拍攝和制作成本高，視頻制作有預(yù)算額度。

內(nèi)容質(zhì)量高：需能展示產(chǎn)品賣點、符合品牌營銷策略，還需具備傳播性和營銷效果。

快速大量生產(chǎn)：需要在短時間內(nèi)制作、測試不同風(fēng)格的視頻。例如：美國的黑五期間，店家可能需要上千條視頻素材，而傳統(tǒng)視頻制作流程復(fù)雜，難快速大量生產(chǎn)。

二、個人對AI視頻產(chǎn)品形態(tài)的思考

2.1 針對C端普通用戶

普通用戶對AI視頻的消費需求，可能帶來AIGC內(nèi)容平臺型機會（類抖音），但現(xiàn)實情況是：針對短期獵奇需求，大部分用戶沒用起來。很多人更愿付費購買“老照片動效成品”，而不是自己使用即夢、Runway等工具。

長期來看，用戶對AI視頻容易失去新鮮感。當(dāng)前AI視頻更多像動態(tài)PPT，鏡頭間不夠連貫，質(zhì)量不如生活實拍效果，更難與影視類的作品相比。用戶更想看的是優(yōu)質(zhì)的、記錄生活的，能引起情感共鳴的內(nèi)容。

如何破局？

第一階段：讓普通用戶，方便的用起來AI新奇功能（類似老照片動效），對應(yīng)功能P0-1、2、3。

第二階段：激發(fā)、滿足長期需求，讓用AI輔助視頻創(chuàng)作成為長期現(xiàn)狀，對應(yīng)功能P0-4。

普通用戶難用起來的原因：

缺乏基礎(chǔ)了解：不清楚AI能力，覺得復(fù)雜高深，沒有很強的嘗試意愿。
不了解AI本質(zhì)是預(yù)測和概率：有的用戶試了一次效果不理想，就覺得功能不行，不再使用。
現(xiàn)有產(chǎn)品功能有使用門檻：視頻生成Prompt撰寫，AI精準(zhǔn)生圖，視頻可控性功能（如首尾幀、動態(tài)筆刷）都有一定的學(xué)習(xí)成本。產(chǎn)品大多也要付費、申請內(nèi)測等。

解決方案

核心是給予用戶引導(dǎo)及例子。從Prompt擴寫、功能模塊化、給例子促靈感三個角度考慮。

整體思路優(yōu)先開發(fā)技術(shù)較為成熟，但仍需改進(jìn)的功能，做出差異化亮點（如對口型和人物一致性），再融入其他功能，最終覆蓋完整視頻創(chuàng)作流程。

P0級功能設(shè)想

P0-1：Prompt模板化、提供擴寫

背景：不同產(chǎn)品推薦的Prompt格式和支持的內(nèi)容不完全一致。例如，都支持風(fēng)格描述，但支持的具體風(fēng)格不同，這可能是由訓(xùn)練視頻的文本描述格式不一致導(dǎo)致。

具體功能：在產(chǎn)品里內(nèi)嵌Prompt模板或提供Prompt擴寫功能。用戶只需填空，例如【主體】+【動作描述】+【環(huán)境背景】+【風(fēng)格】+【畫面質(zhì)量】。每項給出產(chǎn)品支持的種類及含義，如風(fēng)格選項及效果演示。如下實例嵌入產(chǎn)品中：

AI對完成prompt擴寫并生成視頻后，用戶如不滿意，可選擇讓AI在保持用戶輸入主體上，多次隨機生成完整prompt，并提供視頻效果。用戶可再做二次加工。

作用：降低用戶使用門檻。用戶有時只對于畫面主體有想法，但怎樣演繹效果更好，可能需要AI通過多次擴寫prompt給到靈感，充分挖掘視頻生成能力。

P0-2：AI視頻新奇玩法功能化

背景：用戶對文生視頻、圖生視頻這樣的功能名詞，感知不如「老照片互動」、「我來設(shè)計梗圖后續(xù)劇情」這類具體能做什么的名詞強。目前，用戶往往需要搜索教程才會使用。

具體功能：

將AI視頻新奇玩法封裝為一個個功能。例如老照片動效、電視劇梗圖（如容嬤嬤喂小燕子吃雞腿）。用Agent工作流來增加視頻成功的概率，并在功能上做用戶引導(dǎo)，提醒用戶可能需要多試幾次、有合規(guī)風(fēng)險等。

以老照片互動為例，通過人像摳圖、背景融合等工作流節(jié)點，提升功能效果，給予用戶操作教程指導(dǎo)，可能介紹哪些互動關(guān)鍵詞，能讓視頻效果更好。

P0-3：靈感探索站

背景：僅有產(chǎn)品使用教程不夠，用戶需要更多案例來引導(dǎo)創(chuàng)作。

具體功能：提供大量新奇，好玩的素材樣例。同時提供案例背后的模板，用戶可直接套用，或在此基礎(chǔ)上做二次創(chuàng)作。類似Morph studio的功能（下圖）。

作用：完整故事的制作依舊比較復(fù)雜，二創(chuàng)相對容易很多。同時靈感探索站本身也可以是AIGC視頻內(nèi)容消費平臺。

P0-4：AI輔助視頻剪輯

背景：為避免用戶過了新鮮勁后，就不再看AI視頻的情況。找到并激發(fā)AI視頻的長期需求很重要。應(yīng)關(guān)注原本不拍、不剪視頻的普通大眾，因AI降低了操作難度而開始使用。用AI制作動效或視頻圖層，是可能存在的長期需求。

具體功能：AI制作動效或者視頻圖層

作用：實現(xiàn)目標(biāo)用戶的破圈，AI（虛擬）+現(xiàn)實視頻的結(jié)合。既用到了AI視頻能力，又滿足了普通用戶消費“真實生活內(nèi)容”的需求。

P1級功能設(shè)想

P0的需求，核心目的是讓普通用戶能夠用起來。而P1的需求，是能讓普通用戶覺得AI視頻生成好用，實現(xiàn)可能還需技術(shù)進(jìn)步。關(guān)于“好用”，我理解包括：功能多樣明了（對應(yīng)功能P1-1）、更簡便的可控（對應(yīng)功能P1-2）以及流程簡化（對應(yīng)功能P1-3）。

P1-1 融合多種視頻技術(shù)

背景：當(dāng)下AI視頻技術(shù)種類繁多，例如數(shù)字人、對口型、表情控制、圖+人跳舞、換臉、視頻生成等。不同的技術(shù)對應(yīng)不同產(chǎn)品、模型。但對于普通用戶來說，可能會覺得都是視頻。

具體功能：將多種AI視頻技術(shù)融合到同一產(chǎn)品內(nèi)，統(tǒng)一整合，用戶提出需求后，引導(dǎo)用戶具體使用某個功能。

P1-2 視頻內(nèi)容定向修改

通過輸入Prompt調(diào)整視頻內(nèi)元素。每次用戶輸入修改指令后，跳出詳細(xì)的Prompt讓用戶確認(rèn)

除修改視頻內(nèi)人物、物體外，還可通過Prompt修改對話腳本，加上用克隆的原聲重新配音及對口型等功能，類似Vozo。

現(xiàn)有的視頻內(nèi)容難以支持定向修改，往往一點效果不好就必須重新生成，導(dǎo)致視頻抽卡的時間、算力成本高、整體體驗不佳（可能受限于現(xiàn)用的 DIT – Diffusion Transformer 框架，視頻是一次性完整生成的）

P1-3 視頻端到端全自動生成

用戶只需輸入幾個關(guān)鍵詞（如故事主題、風(fēng)格、劇情特色等），系統(tǒng)就能生成一個故事腳本。用戶調(diào)整或確認(rèn)腳本內(nèi)容后，擴寫每一幕場景Prompt。再生成視頻，視頻默認(rèn)風(fēng)格、人臉一致，人物對話、旁白有音效，且對好口型等。真正做到山姆奧特曼所說“電影變成了游戲”，技術(shù)上可能還有距離。

2.2 針對C端專業(yè)視頻制作師

P0級功能設(shè)想

專業(yè)設(shè)計師、剪輯師，已有成熟的視頻生產(chǎn)、剪輯工具，因此需要解決”專業(yè)設(shè)計師為何要用AI視頻產(chǎn)品”的問題，在AI生成質(zhì)量尚未達(dá)到非常高水平的背景下，關(guān)鍵詞是“提效和可控”。

P0-1 更多細(xì)項常用功能：

例如風(fēng)格、人臉保持一致，在當(dāng)前視頻制作工作流中，單個的視頻只有幾秒，為劇情連貫，需抽圖實現(xiàn)人臉、風(fēng)格一致。如能一鍵定義人臉、風(fēng)格，能省不少時間。類似Pixverse V2的加場景功能（人像、風(fēng)格一致性）以及MOKI的風(fēng)格、角色選擇功能。

其他常用功能有很多，例如視頻內(nèi)定向換臉，對口型功能，鏡頭平移但物體不變形等等，目的都是為了提效。

P0-2 更多內(nèi)容元素可控：

除了上面內(nèi)容元素可控外，還包括視頻風(fēng)格、運鏡、幀率、清晰度、表情、背景、光影、圖層、音頻等等也可控，最終不需綠幕就能實現(xiàn)近似專業(yè)影視效果。

當(dāng)前AI視頻一大痛點是對物理世界的規(guī)律和Prompt的理解不足。增強視頻的可控性，可一定程度上解決這些問題。同時也能幫助提效，避免頻繁抽卡。視頻各項元素越精細(xì)化可控，制作效率越高，專業(yè)制作人更可能使用。

這些常用功能看起來已有很多產(chǎn)品在做，但核心是做出差異化，有不同實現(xiàn)方法或者更好模型效果。在完成亮點功能的MVP后，再考慮其他P1級功能，逐步完善產(chǎn)品。例如，可控性方面，Runway做橫縱斜方向的運動筆刷，Pixverse功能上支持以箭頭設(shè)定運動方向，尋夢則預(yù)告實現(xiàn)對圖層的控制。

另外，這些功能或許應(yīng)從海外專業(yè)用戶開始付費推廣。當(dāng)前AI生成視頻產(chǎn)品有算力成本，而海外用戶付費意愿較高，類似Midjourney、Pixverse等產(chǎn)品，優(yōu)先在Discord版推出并收集用戶反饋。先向海外專業(yè)用戶推廣，再相應(yīng)調(diào)整定價策略、產(chǎn)品功能，更有助于實現(xiàn)正向ROI。

P1級功能設(shè)想

覆蓋AI視頻生成全流程：包括生成劇本-生成分鏡表-生成圖片提示詞-挑選圖片-圖生視頻-挑選視頻-剪輯視頻等等，用戶可對每個步驟做進(jìn)一步修改，例如分鏡表中調(diào)整某一幕的運鏡，視頻效果也相應(yīng)調(diào)整。

支持功能協(xié)作：允許多人對一條工作流進(jìn)行加工，并提供權(quán)限控制。

素材管理、剪輯功能：便于組織和管理各類素材。支持強大的剪輯功能，類似剪映、Pr。

專業(yè)用戶在生成完整視頻作品時，需要大量視頻相關(guān)工具（包括劇本生成、補幀、高清化等等），可以將這些功能融合進(jìn)產(chǎn)品。

此外，一個大的作品背后是大量素材（圖片、短片），以及多人的協(xié)作（P1-1、2）和專業(yè)的剪輯，需要素材管理和剪輯功能。

2.3 針對B端用戶（以電商廣告為例）

對于B端用戶來說，視頻創(chuàng)作效率與質(zhì)量至關(guān)重要，視頻需真實還原商品，體現(xiàn)商品賣點，符合品牌調(diào)性。然而，當(dāng)前生成式視頻在可控性、時長上存在短板，容易出現(xiàn)AI痕跡。商拍廣告流量成本又較高。因此，普遍更多使用質(zhì)量可控、能快速大量生成的數(shù)字人、混剪和相冊類視頻，較少使用Sora類視頻生成。

ToB視頻生成的核心內(nèi)容包括“視頻素材生成”以及“端到端視頻生成”，核心都在于設(shè)計好Agent工作流，并針對不同產(chǎn)品類型訓(xùn)練和調(diào)優(yōu)模型。

P0級功能設(shè)想

雖然視頻生成技術(shù)還不成熟，但在tob領(lǐng)域也有應(yīng)用，視頻在吸引客戶的效果上，很多時候比圖片更好，但需要運動幅度小，時長短，效果可控。

動態(tài)微視頻：將圖生視頻的能力固化為功能，用戶可上傳圖片，生成動態(tài)微視頻。

要實現(xiàn)這部分能力，需要更好的Prompt擴寫功能及Agent工作流（融合好運動筆刷效果）。

端到端混剪視頻生成：
通過用戶提供的宣傳關(guān)鍵點、圖片、視頻素材，生成相應(yīng)的腳本文案、字幕、動效。工作流包括：產(chǎn)品亮點素材挖掘、配樂選擇和模板選擇等。例如試衣視頻，涉及摳圖、上身、更換背景、生成動效等步驟，根據(jù)商品類別提供多種混剪模板，生成凸顯產(chǎn)品亮點的混剪視頻。

需設(shè)計好Agent工作流，通過Agent來增加每個步驟的成功概率，可能需要對不同品類的商品，做定向模型訓(xùn)練。例如，介紹椅子時，先介紹面料、人體工學(xué)，從功能到整體，最后細(xì)節(jié)展示，而這套流程可能不適用于鞋類或衣服。

同時，需要根據(jù)用戶反饋，持續(xù)迭代模型及產(chǎn)品。例如，針對衣服的宣傳，如果褶皺飄動效果不自然，可能在調(diào)優(yōu)模型時，需要補充優(yōu)質(zhì)的衣服褶皺、飄動數(shù)據(jù)。

P1級功能設(shè)想

后鏈路數(shù)據(jù)監(jiān)控，記錄不同視頻內(nèi)容帶來的品牌增粉，下載，注冊等。

產(chǎn)品能讓視頻附帶營銷關(guān)鍵信息，例如地理位置、留資鏈接等。

視頻多賬號管理，批量分發(fā)視頻功能。

后鏈路數(shù)據(jù)的效果監(jiān)控，以及讓視頻附帶營銷關(guān)鍵信息對轉(zhuǎn)化非常重要。此外，商家和公司往往有多個自媒體賬號，可能由不同員工負(fù)責(zé)，需有效管理這些賬號，確保視頻內(nèi)容符合品牌調(diào)性。

三、在視頻生成產(chǎn)品中，AI產(chǎn)品經(jīng)理的價值及核心工作是什么

我認(rèn)為核心工作是：找到在當(dāng)前AI技術(shù)能力下，以前滿足不了（或不夠好），但今天能滿足（或能更好）的功能點。具體包括：

找到限制條件下最優(yōu)解
當(dāng)前的一些視頻功能，需要同時兼顧算力消耗、質(zhì)量、用時三個維度，用戶希望生成用時少的基礎(chǔ)上，保持高質(zhì)量。這需要產(chǎn)品經(jīng)理做出取舍。

需求挖掘和功能設(shè)計
AI產(chǎn)品經(jīng)理依舊需確定要實現(xiàn)什么功能，這個新的功能可能是由數(shù)據(jù)集、Agent工作流、RAG等等實現(xiàn)的。但更重要的是明確為什么要這個功能。一切以需求為核心，這也意味著，并不一定要完全AI來實現(xiàn)，更多應(yīng)關(guān)注用戶需求怎樣能被更好的滿足。

模型能力的提升
具體包括：（1）針對目標(biāo)場景，清楚模型哪里還不夠好（2）清楚可以給技術(shù)側(cè)，怎樣的支持幫助調(diào)優(yōu)

通過專業(yè)的視頻評測方法，例如VBench，結(jié)合不同用途人群的反饋來調(diào)優(yōu)模型。廣告設(shè)計師、自媒體、影視設(shè)計師對視頻模型能力，關(guān)注重點可能不同，包括：人物質(zhì)量，動作連貫性，商品效果不佳（褶皺，擺動不自然）等。在確定最先應(yīng)解決的問題后，才能針對提升模型效果。

識別到問題后，除和開發(fā)溝通算法架構(gòu)的提升外，也需考慮訓(xùn)練數(shù)據(jù)的質(zhì)量問題。比如訓(xùn)練數(shù)據(jù)里的Prompt沒有描述清視頻里的多主體，才導(dǎo)致多主體表現(xiàn)效果不佳。增補優(yōu)質(zhì)訓(xùn)練數(shù)據(jù)的同時，也考慮調(diào)優(yōu)數(shù)據(jù)造、挖、洗這整一條數(shù)據(jù)加工流程。

四、“廣告營銷類”AI視頻生成產(chǎn)品mapping匯總（含優(yōu)劣勢分析及優(yōu)秀視頻案例捕捉）

筆者匯總了在AI視頻生成領(lǐng)域內(nèi)的，廣告營銷相關(guān)的各種產(chǎn)品（37個），根據(jù)其核心功能和特性進(jìn)行了分類，并做了優(yōu)劣勢分析。

這些產(chǎn)品的詳細(xì)信息，筆者已整理成表格Excel

根據(jù)這些產(chǎn)品的核心功能，主要對以下4類：視頻大模型、數(shù)字人、多種類AI視頻組合、端到端解決方案，挑了部分產(chǎn)品在本文做簡要介紹。

4.1 視頻大模型

以Sora為典型代表，僅輸入簡單文字提示或者圖片，就可通過模型生成視頻，以下選取了在各項評測中，排名較高的產(chǎn)品。

4.1.1 Pixverse

核心功能包括：

多種生成方式：支持圖生視頻、文生視頻、圖+提示詞生視頻，適用于創(chuàng)作故事和制作廣告。

動態(tài)筆刷：通過在圖片上畫箭頭，用戶可自定義物體移動方向。圖生視頻憑借類似功能，能實現(xiàn)比文生視頻更好的穩(wěn)定性。

風(fēng)格設(shè)置：用戶可選擇視頻風(fēng)格，包括寫實風(fēng)格、動漫風(fēng)格、3D風(fēng)格等。

角色一致性控制：可通過上傳角色的照片，較好的控制視頻一致性。該功能對于影視類廣告、劇情類廣告效果很重要。

4.1.2 Pixeling千象

一款全中文、易上手的AIGC創(chuàng)作平臺和社區(qū)。注重用戶友好和簡單操作，幫助用戶零基礎(chǔ)輕松使用一站式功能。核心功能包括：

文生視頻、圖生視頻、運動幅度設(shè)置、視頻橫縱比設(shè)置、鏡頭控制等。

電商百寶箱（E象）：提供了專門為電商設(shè)計功能組，包括商品視頻模板和多種實用的電商圖片處理工具。

4.2 多種類AI視頻組合

4.2.1 布爾向量（BOOLV）

將出海、海外電商用戶可能用到的許多功能，都集成到同一個產(chǎn)品上，提供從商品鏈接到視頻生成，再到效果分析的全鏈路支持。

核心功能包括：

電商鏈接一鍵生成視頻：用戶可通過輸入電商平臺（如 Shopify、Amazon等）商品鏈接，快速生成相關(guān)視頻。

多種視頻生成方式：支持從圖片、腳本、博客內(nèi)容和模板生成視頻，并提供視頻增強功能。這里與視覺大模型不同點在于，布爾向量的成品更像是各類模板視頻、移動相冊圖的排列組合。

提供方便簡潔的視頻剪輯工具。

提供視頻效果分析工具，商家可憑借效果數(shù)據(jù)，更好的調(diào)整和優(yōu)化視頻內(nèi)容。

產(chǎn)品優(yōu)勢

場景適配度高：BOOLV專門面向電商用戶。模型本身對電商場景和品類做了微調(diào)，在功能上，覆蓋了許多海外電商用戶“生成營銷內(nèi)容場景”。

穩(wěn)定性高：由于視頻依賴于模板和圖片輕微移動、鏡頭平移，布爾向量的視頻穩(wěn)定性和一致性更高。

形式多樣：布爾向量和廣州美院合作，制作了大量針對各類場景，有藝術(shù)氣息的模板，并支持多種元素（如音樂、字幕、特效、貼紙）的組合，使得視頻內(nèi)容更加豐富有趣，效果不單一。

4.2.2 其他同類產(chǎn)品

Creatify：能夠自動分析產(chǎn)品信息，并生成腳本。提供了多樣化的語音選項和數(shù)字人。

特看：不僅提供視頻制作功能，還包含視頻效果數(shù)據(jù)監(jiān)控和各類榜單（如達(dá)人榜、商品榜、視頻榜、話題榜），商家可結(jié)合這些榜單效果，判斷爆款商品、視頻類型。此外，支持AI直播相關(guān)功能。

這類產(chǎn)品由于功能更加豐富，不局限于某一種技術(shù)路線。且覆蓋了出海電商視頻制作中各場景需求，使得電商視頻制作效率大大提升。

4.3 數(shù)字人

Heygen

核心功能包括：

數(shù)字人克隆：用戶可上傳自己的聲音和畫面，來克隆一個數(shù)字化的自己。這使得個人和企業(yè)能快速生成與自身形象相符的數(shù)字人。

允許用戶通過上傳照片，或選擇預(yù)設(shè)模板來生成數(shù)字人。支持語言翻譯，保持口型一致。

優(yōu)勢：

操作簡單快捷：技術(shù)相比視覺大模型來說更成熟，不需要許多后期剪輯技巧，用戶可輕松創(chuàng)建適用各種場景的商業(yè)視頻。

多語言支持和本地化：提供換語言及調(diào)整口型功能，有非常大的用戶群體。本地化的內(nèi)容對營銷效果來說，可以極大的增加可信度和營銷效果。

劣勢：

產(chǎn)品價格高：生成1分鐘的視頻需要2美金。與傳統(tǒng)拍攝方案相比，價格不算高。但由于算力消耗方面的考慮，HeyGen編輯視頻的過程無法預(yù)覽效果，用戶在制作過程中需要反復(fù)調(diào)整，會重復(fù)支付費用。

AI感比較明顯：雖然Heygen的產(chǎn)品能力在數(shù)字人領(lǐng)域，已處于領(lǐng)先的狀態(tài)，但數(shù)字人技術(shù)的局限性依舊存在，視頻不夠生動、聲音略機械、肢體動作較少、缺乏情感等等，長時間看到同類視頻后，用戶容易發(fā)現(xiàn)不是真人。對消費者來說形式依舊偏單一。

數(shù)字人類產(chǎn)品非常多，包括用D-ID、Elai、奇妙元等?？傮w而言，通過數(shù)字人技術(shù)，可較低成本的，短時間內(nèi)制作出大量營銷視頻，如果視頻中需要人做產(chǎn)品介紹，而商家自己又不想出鏡，是可以大體滿足需求的。

4.4 端到端解決方案

FancyTech

與其他同類產(chǎn)品的不同點在于，不提供視頻生成工具，而是轉(zhuǎn)向提供結(jié)果。FancyTech聯(lián)合創(chuàng)始人Morgan表示，傳統(tǒng)SaaS訂閱費并不能免除提供商與客戶持續(xù)互動的責(zé)任，這使得服務(wù)交付成為業(yè)務(wù)的重要組成部分，避免過多的產(chǎn)品定制化。

根據(jù)布爾向量CEO王慶描述：

“現(xiàn)有電商商家主要分為兩類，一類用戶是研發(fā)能力很弱，相對比較傳統(tǒng)，但他們業(yè)務(wù)體量可能很大；第二類客戶的話相對比較年輕，然后他們有比較好的研發(fā)能力。這兩類客戶商業(yè)模式不太一樣。

針對第一類客戶來說，他們更多是希望你能做交付。因為缺乏研發(fā)能力，做部署化 SaaS 和交付就會比較好。第二類客戶會更加希望做共創(chuàng)。比如給到 API，在業(yè)務(wù)流的某一個環(huán)節(jié)給到支撐。

FancyTech類的服務(wù)，可以滿足第一類客戶的需求。我相信隨著技術(shù)的不斷升級，用戶結(jié)合相應(yīng)產(chǎn)品制作視頻的成本不斷降低，會有越來越多的第二類客戶。

作者：產(chǎn)品經(jīng)理@Sean ，過去4個月，他mapping了行業(yè)內(nèi)所有AI視頻相關(guān)產(chǎn)品和公司。

來源微信公眾號：hanniman

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理，未經(jīng)許可，不得轉(zhuǎn)載。

題圖來自Sora生成視頻截圖

該文觀點僅代表作者本人，人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。

更多精彩內(nèi)容，請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App