AI改造直播間
AI技術(shù)正在帶給行業(yè)更多的想象空間,其中,電商行業(yè)就受到了AIGC的強(qiáng)烈沖擊,越來越多AI主播出現(xiàn)在直播間里,商家和平臺也對此做出了各自的應(yīng)對策略。那么,AI直播,又或者說數(shù)字人直播,當(dāng)下的發(fā)展如何?一起來看看作者的解讀。
“歡迎xx來到直播間”“我們這款產(chǎn)品……”
凌晨,打開抖音、淘寶、攜程等平臺,仍然有主播在直播間循環(huán)介紹著店里的幾款商品。但她們略顯機(jī)械的語句停頓與固定的幾個手勢循環(huán),可以看出,這些主播并不是真人出鏡,而是AI數(shù)字人。
AI浪潮下,虛擬主播在今年618之際加速卷入直播間。
618期間,京東更是推出“言犀虛擬主播”產(chǎn)品,幫助商家減負(fù)增收。據(jù)京東戰(zhàn)報顯示,開門紅開啟10分鐘,數(shù)字人直播間開播商家數(shù)較去年雙11增幅近400%。另外,像雅詩蘭黛、歐萊雅、寶潔等品牌也已經(jīng)在嘗試接入虛擬主播服務(wù)于直播電商。
今年上半年,ChatGPT、Midjourney、文心一言等產(chǎn)品的出現(xiàn),掀起了AI新一輪的技術(shù)革新浪潮。AI在給一些行業(yè)帶來更多想象空間的同時,也給很多“打工人”帶來了危機(jī)。
一時間,關(guān)于“AI替代人類”“AI導(dǎo)致失業(yè)”的討論也甚囂塵上。
如今, AIGC 技術(shù)率先被電商行業(yè)廣泛應(yīng)用于實踐,伴隨著越來越多的AI主播出現(xiàn)在直播間,AI替代論似乎也開始從預(yù)知變?yōu)楝F(xiàn)實。
一、AIGC“落地”直播間
將虛擬人應(yīng)用于文娛、短視頻、直播帶貨等領(lǐng)域其實并不算什么新鮮事。在此之前,已經(jīng)有洛天依、A-Soul這樣的二次元虛擬IP,也有3D超寫實數(shù)字人柳夜熙出圈。
而當(dāng)前風(fēng)靡直播間的AI主播屬于2D超寫實數(shù)字人,這一技術(shù)以真人為原型,復(fù)刻主播的形象、聲音,以及表情動作,打造出一個與真人相似度極高的仿真人。2D超寫實數(shù)字人更像是專門為直播場景量身打造的。
雖然像文旅展廳、新聞資訊、學(xué)校等也都已經(jīng)在接入數(shù)字人,但AI主播在直播帶貨場景的應(yīng)用則意味著AIGC的商業(yè)化落地開始轉(zhuǎn)向C端變現(xiàn)。
“AI主播這一塊可以說是AIGC技術(shù)最容易應(yīng)用實踐的,或者說更容易變現(xiàn)的一個領(lǐng)域?!泵鎸I主播的風(fēng)潮,即構(gòu)科技一位內(nèi)部人士如此評價。
即構(gòu)科技在2019年之前就開始投入對AI的研究,基于微博、陌陌、映客、TT 語音等客戶基礎(chǔ),此前其AI技術(shù)主要運(yùn)用于泛娛樂以及社交領(lǐng)域?!氨热缫曨l美顏、聲音降噪,視頻的摳圖,都會應(yīng)用到AI技術(shù)?!?/p>
事實上,AIGC產(chǎn)業(yè)鏈逐步完善和成熟是AI數(shù)字人涌入直播間的主要推力。例如實時音頻的即構(gòu)科技、AI作畫平臺研發(fā)供應(yīng)6pen、超擬人大模型研發(fā)商聆心智能等。“去年,虛擬人就已經(jīng)作為我們元宇宙解決方案里面的其中一個產(chǎn)品出現(xiàn),即用戶在元宇宙里面的數(shù)字分身,當(dāng)時是偏3D建模的方向,我們的虛擬人Zego Avatar可以做到面部表情到四肢動作隨動,將真人姿態(tài)在虛擬形象上進(jìn)行實時的還原渲染,在交互空間里轉(zhuǎn)身、跳躍等完成一些更復(fù)雜的動作?!?/p>
“到了今年,我們就從AI團(tuán)隊專門抽調(diào)了一部分人去做數(shù)字人項目,這次做的則類似于仿真人,主要用途就是在口播這一領(lǐng)域?!蹦壳耙惨呀?jīng)有很多MCN、廣告公司、設(shè)計公司、學(xué)校在與其數(shù)字人服務(wù)進(jìn)行合作接洽。
而之所選擇從“口播”切入,數(shù)字人技術(shù)廠商們也是看準(zhǔn)了短視頻、直播行業(yè)的切實需求。
上述人士直言,對于MCN等公司來說,引進(jìn)虛擬主播可以說是一個很好的規(guī)避風(fēng)險、降本增效手段。
“譬如發(fā)生像李子柒這類大IP與MCN公司分道揚(yáng)鑣的事件,很多MCN是保不住IP資產(chǎn)的。若主播一開始就在公司錄制了數(shù)字分身,并明確了歸屬,那么這個數(shù)字分身會一直作為公司資產(chǎn),不會因為主播出走而流失?!?/p>
另外,虛擬主播最直接需求便是打破真人主播在直播時長等方面的制約,做到24小時不間斷直播。在現(xiàn)有案例中,一些商家已經(jīng)選擇將AI主播用于夜間直播,作為真人主播在時間上的補(bǔ)充。
一位MCN人士表示,在直播帶貨的過程中,場景搭建也是一塊不小的支出,而且很多物料不能被重復(fù)利用,常常被浪費。數(shù)字化場景的搭建同樣有AI技術(shù)的用武之地。
另一個層面來看,與其說是AI替代真人主播,它其實也正在作為一種工具促進(jìn)生產(chǎn)力與創(chuàng)造力的解放,為內(nèi)容創(chuàng)作者騰出了時間和空間在“幕后”做更多的創(chuàng)意性的工作,比如產(chǎn)品特色梳理、直播互動體驗優(yōu)化、直播間搭設(shè)升級等。
據(jù)光子星球了解,目前市面上定制一個仿真主播,其成本價基本在一萬多的水平,這對比真人直播的人力成本,顯然能夠縮減開銷。
理想狀態(tài)下,若虛擬主播能夠在逼真程度、即時反饋等方面做到與真人主播無異,這對于直播行業(yè)的影響不言而喻。
但實際效果還遠(yuǎn)沒達(dá)到這個程度。
另一位數(shù)字人廠商人士志輝(化名)表示:“我們目前已經(jīng)有一些MCN、本地生活服務(wù)商達(dá)成合作,另外像保潔、貝亦美、奧迪汽車等品牌也即將會展開合作,但直播效果還是要視情況而定?!?/p>
“目前來看,數(shù)字人的服務(wù)場景是有限的。現(xiàn)在在本地生活團(tuán)購、文旅產(chǎn)品等直播話術(shù)相對固定,且重復(fù)頻率較高的直播間運(yùn)用的比較多。而像美妝等口紅產(chǎn)品需要沉浸式介紹,AI主播還難以做到?!?/p>
除此之外,像快消百貨等標(biāo)品介紹、知識型的短視頻與直播,講解話術(shù)相對統(tǒng)一,也能夠適用虛擬主播。
要論結(jié)果,目前AI主播還遠(yuǎn)不能達(dá)到真人直播的效果。但正如一位抖音本地生活服務(wù)商人士所言:“我們大家都還在‘試’,前期肯定是有一個探索完善的過程?!?/p>
二、AI主播不夠“AI”
AI主播不夠“AI”,也是目前制約其直播效果的最直接因素。
對于虛擬主播的工作原理,上述數(shù)字人廠商人士志輝表示,作為技術(shù)廠商,我們主要是為客戶提供一個saas軟件,通過軟件直接推流到第三方平臺去做直播。然后客戶在這個軟件后臺去設(shè)定所謂的“人貨場”,即開播前在后臺選擇虛擬主播、提前設(shè)定好產(chǎn)品介紹,以及可以去生成數(shù)字化的直播場景。
“我們現(xiàn)在的商業(yè)邏輯主要就是把軟件功能做好,然后客戶通過軟件去管理直播間,以更方便的在后臺去編輯、更改直播內(nèi)容?!?/p>
可以看出,廠商更多的是將AI技術(shù)應(yīng)用于數(shù)字人的生成上,但是涉及到具體的直播時,他們更像是提供了一個輔助直播的管理工具。
直播時,現(xiàn)場互動以及反饋直播間用戶的提問是提升直播效果非常重要的一個部分。
但上述即構(gòu)科技內(nèi)部人士坦言:“現(xiàn)階段數(shù)字人直播時都需要提前準(zhǔn)備一個問題庫,直播過程中收到相關(guān)彈幕或提問,就在問題庫內(nèi)調(diào)取相關(guān)回答,問題庫的內(nèi)容越全面、越細(xì)致,數(shù)字人直播的互動體驗才能相應(yīng)提高?!?/p>
相當(dāng)于AI主播在工作時,工作人員不僅要事先準(zhǔn)備相關(guān)產(chǎn)品介紹話術(shù),涉及臨場互動的問答也要提前預(yù)設(shè)好。
目前,數(shù)字人直播仍然囿于問題庫的預(yù)設(shè)來驅(qū)動實時反饋和互動效果,若要做到真正的開放性回答,這其中既有技術(shù)的難題,也有監(jiān)管等問題,譬如對一些敏感詞的觸碰。
“未來肯定會接入ChatGPT那樣的能力做開放性的回答,比如做個圍欄限定開放性回答的可控范圍,目前還在技術(shù)研究的過程中?!?/p>
當(dāng)前,行業(yè)對于AI數(shù)字人直播的探索仍然停留在工具階段,還代替不了運(yùn)營。但技術(shù)的突破與以及價格的下降已經(jīng)使得虛擬主播具備了走向大眾化的基礎(chǔ)。
如今AI主播的定制過程并不復(fù)雜,用戶只需提供一段形象視頻與直播話術(shù)音頻,幾天后就能拿到一個1:1克隆的數(shù)字人。
隨著數(shù)字人在直播等場景的需求被開發(fā)出來,需求攀升的同時也使得更多的科技公司加入數(shù)字人研發(fā)的大潮,進(jìn)而推動數(shù)字人價格的下降?!皫啄昵埃┡_定制一個數(shù)字人,就要花幾十萬?!?/p>
一位淘寶數(shù)字人定制廠商則表示,基于真人的聲音與形象定制一個數(shù)字人的價格為11000元,終身使用,后續(xù)再無其他費用。若是購買公司的固定數(shù)字人模板,價格則更低。
在這個過程中,越來越多自稱是AI數(shù)字人定制的商家逐漸滲透至淘寶、抖音、快手、閑魚等平臺,品牌、用戶等接觸到AI定制服務(wù)的門檻也在降低。
而那些散落在各個平臺的商家,則更多的是代理商,或者其他中間商。這其中也混雜著不少假AI商家,比如一段視頻動作循環(huán)播放,并未體現(xiàn)多少的智能化。
“目前真的在做技術(shù)研發(fā)、產(chǎn)品開發(fā)的源頭廠商,整個行業(yè)也就二十多家,我們作為其中一家自研企業(yè),也正處在打渠道的階段。”一位業(yè)內(nèi)人士表示。
三、探索與不確定性
一位電商行業(yè)人士表示,2021年他們便開始在TikTok嘗試虛擬直播,但沒做幾個月就不得不停了。“當(dāng)時虛擬直播同質(zhì)化很嚴(yán)重,互動少,平臺封得厲害。”
國內(nèi)電商平臺同樣如此,此前也有類似于動畫人物形態(tài)的虛擬主播被用于淘寶天貓直播間,可惜在直播效果、視覺化、互動等方面始終差強(qiáng)人意,虛擬直播并沒有被廣泛的應(yīng)用。
“現(xiàn)在抖音已經(jīng)明確開放了數(shù)字人直播,其實從這些平臺的態(tài)度就已經(jīng)能夠看到AI直播的大趨勢。”一位電商行業(yè)人士表示。
AI直播作為一個新型事物,目前處在發(fā)展應(yīng)用的初期,但平臺、商家,以及MCN等都表現(xiàn)出了擁抱探索的心態(tài)。
5月9日,抖音發(fā)布《抖音關(guān)于人工智能生成內(nèi)容的平臺規(guī)范暨行業(yè)倡議》,針對人工智能生成的視頻、圖片和衍生的虛擬人直播,首次明確其在平臺內(nèi)的行為規(guī)范。本次新規(guī)推出,虛擬主播不再游走于抖音審核邊界,正式“合法化”??焓?、淘寶直播等平臺目前暫時還未跟進(jìn)。
抖音強(qiáng)調(diào)內(nèi)容為王,利用人工智能輔助的創(chuàng)作內(nèi)容與其他內(nèi)容擁有同等的流量分配規(guī)則,用戶可以依托技術(shù)進(jìn)行輔助創(chuàng)作具有更高質(zhì)量的內(nèi)容,但不提倡利用低成本技術(shù)優(yōu)勢生成低質(zhì)內(nèi)容。同時需要進(jìn)行實名注冊,并標(biāo)識虛擬人直播。
“平臺是開放的,但它最根本的標(biāo)準(zhǔn)在于你得輸出一些高質(zhì)量的內(nèi)容。比如你不能錄播,在直播過程中得有實時的提問和反饋等?!盇I生成內(nèi)容成本低,容易陷入低質(zhì)內(nèi)容的漩渦,平臺開放后同樣會對低質(zhì)內(nèi)容進(jìn)行管控。
“我們只能盡量做到合規(guī)?!鄙鲜鋈耸恐毖浴?/p>
技術(shù)的發(fā)展有一個過程,目前AI直播在互動反饋、畫面效果等方面仍然存在著短板,而技術(shù)的突破也直接決定了數(shù)字人直播的發(fā)展走向。
作者:何芙蓉;編輯:吳先之
來源公眾號:光子星球(ID:TMTweb),細(xì)微之處,看見未來!
本文由人人都是產(chǎn)品經(jīng)理合作媒體 @光子星球 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于 CC0 協(xié)議。
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
非常認(rèn)同您的觀點,上周我就組織了一個微軟AI的數(shù)字人代理商來司溝通,現(xiàn)場就定義現(xiàn)在所謂的ai直播更多的是工具屬性產(chǎn)物,依舊需要員工做大量前置工作,而且用來直播的數(shù)字人沒有開放性,所有對話和產(chǎn)品知識只能在后臺“窮舉”,而且不能接入GPT,最后也沒有在業(yè)務(wù)板塊接入AI