AI的下個進(jìn)化和爆點(diǎn)
隨著AI技術(shù)的飛速發(fā)展,視頻生成領(lǐng)域正迎來前所未有的變革。本文將深入探討AI在視頻生成方面的最新進(jìn)展、未來趨勢以及可能帶來的大眾機(jī)會。你是否準(zhǔn)備好迎接這個充滿潛力的新領(lǐng)域?
產(chǎn)品視角看技術(shù)一般不看原理就看效果。
每天會我花點(diǎn)時間觀察AI的最新進(jìn)展。方法是有API的主要方法就是建立測試集各種測,視頻這類的我主要就看非官方出品的到底做成什么樣了,是不是具有普遍性。
看多了上面這些視頻后,我是兩點(diǎn)感想:
第一,視頻生成這事真的要到爆的時候了。
第二,GPT5這檻大概率是能過去的,雖然是不是OpenAI先過不好說。
在這個新機(jī)會點(diǎn)徹底爆開和現(xiàn)在之間其實(shí)是AI的小低潮:為什么說AI會迎來自己的小低潮?
一、為什么說視頻生成要爆呢?
模型方的官方視頻因?yàn)橛欣可?,最多可以看看苗頭,不太能信。
所以得換個視角,如果一般用戶以一定頻次和量級持續(xù)往出爆精彩視頻,那就差不多到臨界點(diǎn)了。你看當(dāng)年MJ火起來之前也是這樣,持續(xù)各種圖片被爆出來。因?yàn)樯缃痪W(wǎng)絡(luò)上持續(xù)爆視頻這事必須滿足倆條件:
第一個是質(zhì)量得讓人驚訝。超出原有認(rèn)知。
第二個得相對容易和便宜,很多人都能做了。
前一個是時機(jī),后一個是基礎(chǔ)。缺一個也不行?,F(xiàn)在那有誰沒事爆圖片的,即使圖片比過去做的還驚艷,也沒人看啊。
現(xiàn)在看這倆條件基本滿足了,只差一點(diǎn)點(diǎn)。一旦這個滿足了,就變成AI的下個大眾型機(jī)會點(diǎn)。
二、為什么說是大眾機(jī)會呢?
AIGV(Video)這是我杜撰的一個詞,但確實(shí)應(yīng)該區(qū)分生成文本、圖片和視頻。因?yàn)樗麄冇绊懥考壘筒豢赡芤粯?strong>。國內(nèi)的頭部主播收入和過去博主收入就不在一個數(shù)量級上,甚至都不是十倍百倍的差異。假如抖音上市等于多少個小紅書和知乎呢?
現(xiàn)在這個視頻生態(tài)面臨洗牌,一波人要上機(jī)關(guān)槍了,另一波人還是大刀長矛,所以這影響恐怕比過去文章生成大的多。他會推進(jìn)視頻平臺往不可測的方向發(fā)展。
視頻平臺外的部分我們反倒是能看的清楚一些,甚至發(fā)展路線過去都操練過一遍了。
先是新版李一舟會出一波。這時候的內(nèi)容生成面臨雙重專業(yè)性,一部分是視頻生成的模型,一部分則是視頻本身的某些技巧。
也還是會有套殼的工具,Heygen這種不完全產(chǎn)生視頻的工具都每年2000萬美金,這里的新工具應(yīng)該價值更大。
然后大量AI生成的內(nèi)容會進(jìn)入各個平臺。各個平臺估計(jì)會有點(diǎn)糾結(jié),但最終還是會像現(xiàn)在這樣,基本還是允許,最多加個標(biāo)注。
再往后會往縱深發(fā)展,不停留在宣傳片這個層次,而是向短?。ǘ巫?、動畫等)發(fā)展。這時候會再炸一下,因?yàn)楹蜕弦徊ǖ倪M(jìn)展就重疊了。之前AI碰撞局上,周瑋分享過他寫短篇小說的Agent,聽過后你就知道這類產(chǎn)品再結(jié)合上視頻生成能力,特別的契合。這類產(chǎn)品的價值空間一下子就會上來很多。
再之后估計(jì)就是長劇和直播。其中直播稍微復(fù)雜點(diǎn),因?yàn)橐徒?jīng)常說的動捕做結(jié)合,做到特別逼真恐怕還要花點(diǎn)時間。
最后肯定是電影。扔本小說,AI改出劇本,AI生成電影,這是什么感覺?
先縱后橫的AI
之前文章中提到過幾次,AI和互聯(lián)網(wǎng)最大的不一樣是先縱后橫,像打深井,現(xiàn)在這里深井又多了一口。
文圖是一口井,視頻是一口井,并且更深更大。
更有意思的是這是個大眾機(jī)會,大廠好像也不能基于這個做什么壟斷產(chǎn)品。
每個人差不多是平等的,它輔助你的創(chuàng)意實(shí)現(xiàn),培養(yǎng)一批工具和教工具的人。
先縱后橫會導(dǎo)致這這么一個狀態(tài):它不會一下子炸的那么厲害,比如一下子就出個微信,但會持續(xù)炸。
這時候面對它的基本方法論根本不是高瞻遠(yuǎn)矚,而是要回到現(xiàn)場,需要AI碰撞局這類把案例聚集起來的,讓大家能鮮活感受AI應(yīng)用現(xiàn)場的手段。
再簡單了說就是實(shí)事求是,得知道情況是什么,別人干成什么樣了,然后形成自己判斷,自己不理解的就當(dāng)不存在,至少不能用來做事。
這和互聯(lián)網(wǎng)非常不一樣。那個是一波大浪沖到底過去就過去了。
三、徹底成熟了什么樣?
我之前發(fā)了這么個視頻,沒想到自己讀者群(進(jìn)讀者群大家發(fā)私信吧)里還有幾個這方面專家,又多聊了幾句我就發(fā)現(xiàn)這是個成熟產(chǎn)業(yè)。
上面的生成視頻技術(shù)一成熟再加上視頻里的這套技術(shù),有可能催生這種產(chǎn)品:
一個人有一個自己的分身,這個分身就是視頻里那種產(chǎn)品,然后生成腳本、生成內(nèi)容、發(fā)布是全自動的,你對著說它就能發(fā)布內(nèi)容。剪映什么的就不要了。這市場應(yīng)該還很大,真有愿意干的可以試試。
這東西就每人多一個手機(jī),但這手機(jī)能自己動起來,生成內(nèi)容發(fā)布內(nèi)容,和直播架子、話筒什么的其實(shí)差不多,需要的量還很大。有人估計(jì)用去做水軍,但那是做水軍違法,就和有人用手機(jī)打詐騙電話,但不能說是電話的問題類似,無人機(jī)不也用來扔炸彈么。
四、GPT5最終肯定會來
看著視頻的進(jìn)展,我就比較確定GPT5肯定會來。
現(xiàn)在GPT5是個符號,也說不清到底是什么,隱喻就是AI能再進(jìn)展一步。倒不一定是OpenAI的下個版本,它標(biāo)識著通用智能是否還能再跳一級,智能的通用性每跳一級,其影響和單純生成視頻肯定不一樣。參見:AI與人類的中線。
為什么說GPT5一定會來呢?
比如說理解物理世界有自己世界模型這事,在生成文字和圖片的時候理不理解物理世界是不關(guān)鍵的。但生成視頻的時候如果不理解物理世界,細(xì)微的地方是做不好的。
解讀為什么可以看論文,但看結(jié)果就是AI對物理世界的理解在深入,它在形成屬于它自己的世界模型。
假如有一天AIGV(Video)能夠生成現(xiàn)實(shí)世界的各種電視劇,也能夠生成各種精彩的奇幻電影,那它的世界模型就必然同時覆蓋現(xiàn)實(shí)空間和虛擬世界(比如漫威宇宙)。
從這個角度看視頻生成和GPT5差不多是同步的。
是不是OpenAI反倒是不好說,OpenAI宮斗了一場后看著有點(diǎn)抓瞎,總是很隨性的發(fā)產(chǎn)品,然后Sam Altman不解決公司迫在眉睫的問題,沒事去發(fā)表涉政言論,這怎么看也路子不對。但這是另外的故事了。
五、小結(jié)
想到AI的終極可能會想到無處安放的自己,并恐慌,但看過程其實(shí)它也在創(chuàng)造一個個大眾型機(jī)會。在這個時間點(diǎn),這類充滿活性,還給一般人機(jī)會的領(lǐng)域沒想的那么多了。還是應(yīng)該多擁抱和碰撞。如果說之前階層固化的程度是1,那AI之后的世界里可能是100(在我預(yù)測的不好的結(jié)局里),所以在不良脈絡(luò)里這可能是最后的機(jī)會。
專欄作家
琢磨事,微信公眾號:琢磨事,人人都是產(chǎn)品經(jīng)理專欄作家。聲智科技副總裁。著有《終極復(fù)制:人工智能將如何推動社會巨變》、《完美軟件開發(fā):方法與邏輯》、《互聯(lián)網(wǎng)+時代的7個引爆點(diǎn)》等書。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于 CC0 協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
- 目前還沒評論,等你發(fā)揮!