萬字長文:ChatGPT商業(yè)化落地方向拆解
ChatGPT 的出現(xiàn)將 AIGC 這個(gè)概念捧上了熱度高點(diǎn),但是在討論熱度過后,ChatGPT 的發(fā)展還需面臨一個(gè)關(guān)鍵問題,即其如何才能實(shí)現(xiàn)商業(yè)化落地,找到后續(xù)的發(fā)展路徑?那么對?ChatGPT 而言,有哪些可以參考的商業(yè)化落地方向?
前言:我希望謹(jǐn)慎地做出判斷
雖然媒體狂歡、大廠跟進(jìn),所有跡象都表明一個(gè)新時(shí)代正在到來。
但是在前文發(fā)布后,我和很多人進(jìn)行了交流。給我印象最深刻的就是,有些朋友在表達(dá)感謝后,總會(huì)忐忑地追問一句——“你覺得ChatGPT方向能落地嗎?”
他們中有面臨職業(yè)抉擇的打工人,有躍躍欲試的創(chuàng)業(yè)者,有二級市場的沖浪者,有一級市場態(tài)度謹(jǐn)慎的投資人。所有人都在岸邊謹(jǐn)慎、克制地觀望。所以,究竟能落地嗎?如果能,是100%完全能嗎?哪些方向可以哪些方向不可以?如果不可以,那么為什么不可以?
因?yàn)樯倌陼r(shí)的AI幻想成真感動(dòng)感動(dòng)是一回事,客觀的現(xiàn)實(shí)又是另一回事。而且當(dāng)我的建議會(huì)對其他人產(chǎn)生影響,這就愈加讓我謹(jǐn)慎。
OK,前言就到這里,我將開始我的推理過程,向你展示我整個(gè)過程中的所思所想。
如果你對推理過程不感興趣,可以直接看結(jié)論——“我相信他能夠成功落地,并且將是一個(gè)時(shí)代的開始?!?/strong>
但是我更希望你跟隨我的思考過程,就像GPT模型中用到的思維鏈CoT技術(shù)一樣,我們“think step by step”,當(dāng)每個(gè)環(huán)節(jié)都清晰無誤時(shí),最終的答案也將更值得信任。
第一步:開始思考前,想清楚如何思考
我們需要更清晰地定義我們的問題,從我們自身的角度出發(fā)(打工人、創(chuàng)業(yè)者、投資者等)。并在隨后圍繞定義來確定我們要去加載哪些方面的知識,并基于這些知識做出符合利益和邏輯的推理。
我所尋求的答案是“AIGC這波狂潮能否落地”,那么:
01
首先,這是一門生意。而生意的本質(zhì)就是價(jià)值交換,并在過程中積累剩余價(jià)值。所以他的首要原則一定是能跑通商業(yè)模式,賺到利潤。
當(dāng)然,生意要賺到錢是誰都知道的道理。AI繪畫也能賺到錢啊,有人靠激勵(lì)廣告打平收益,有人拿到了融資,有人延伸出了提示語買賣。
02
是的,所以我還期望他具備足夠?qū)挾鹊馁惖?/strong>,能夠支撐百花齊放。因?yàn)檫@樣對于打工人來說,他進(jìn)入這個(gè)方向才足夠?qū)掗?,擁有突破天花板的可能,對?chuàng)業(yè)者來說市場的機(jī)會(huì)足夠多,避免扎堆死在沙灘上,對于一級市場投資者來說有足夠的種子進(jìn)行選擇試錯(cuò),對于二級投資者來說,百花齊放的涌現(xiàn)才是這個(gè)賽道長久生長的推力。
在這里我們觀察一下AI繪畫,他的賽道是不是一眼就望到了盡頭?你敢投入其中嗎(此處假裝忽略Diffusion技術(shù)后續(xù)的潛力)?
03
然后,找到新技術(shù)帶來的增量市場。
我們要避免被媒體詞語迷惑。什么是媒體詞語?就是標(biāo)題中的“AIGC”。
事實(shí)上這波狂潮中只有AI繪畫背后的Diffusion和ChatGPT背后的GPT這兩項(xiàng)技術(shù)產(chǎn)生了應(yīng)用端的突破。但是AIGC詞語一造出來,干涸的互聯(lián)網(wǎng)終于迎來了久違的新概念,媒體迫不及待將他扶上王座,繪制出一張張行業(yè)全景圖。
但事實(shí)上真正因?yàn)檫@兩項(xiàng)技術(shù)發(fā)生影響的行業(yè)是哪些?受到影響的行業(yè)就一定存在增量機(jī)會(huì)嗎?我搜集材料時(shí)一般剛開始的時(shí)候是不看投研式的報(bào)告的,很寬很全,但是好像知識從腦子流淌過去,看完什么也沒留下。
特別做過匯報(bào)PPT的人應(yīng)該知道,很多時(shí)候?yàn)榱私Y(jié)構(gòu)式美觀,你會(huì)硬湊信息,比如這個(gè)產(chǎn)業(yè)鏈只有2條不好看呀,我湊夠3個(gè)來個(gè)金字塔布局。這種信息會(huì)誤導(dǎo)思維框架的的建立,我一般是建立了體系化認(rèn)知再去看報(bào)告來補(bǔ)充參考的。
OpenAI CEO對資本造詞“生成式AI”的嘲諷
05
緊接著,讓我們首先瞄準(zhǔn)核心的應(yīng)用場景,暫時(shí)忽略上下游布局。
當(dāng)一個(gè)地方發(fā)現(xiàn)金子,馬上就會(huì)有為淘金者服務(wù)的餐館、旅館、勞保店出現(xiàn),但這這一切的前提在于必須能發(fā)現(xiàn)金子。核心應(yīng)用場景就是這波浪潮中的金子,只有找到在消費(fèi)端能夠跑通模式的場景,才會(huì)關(guān)聯(lián)延伸出相應(yīng)的上下游產(chǎn)業(yè)。因此在這個(gè)問題的思考過程中,上下游產(chǎn)業(yè)是不重要的,我們不需要投注任何精力去關(guān)注。
06
最后,讓我們基于如上推理,重新構(gòu)筑對這個(gè)問題的定義:“當(dāng)前是否有足夠多的受到兩個(gè)新技術(shù)影響且產(chǎn)生增量機(jī)會(huì)的核心場景能夠跑通生意模式,獲取盈利”。當(dāng)我們收集的知識滿足這些條件,我們就認(rèn)為答案是“是”。推導(dǎo)順序如下圖:
第二步:開始組裝知識框架
在有了思考的方向后,我們需要構(gòu)造知識框架,哪些重要、哪些不重要、哪些要素之間互相關(guān)聯(lián)、影響、先后順序是什么等等。
首先,搞錢是最重要的,即核心場景,第一個(gè)要做的就是盤點(diǎn)應(yīng)用場景,客觀評估其商業(yè)模式及可行性。
其次,場景不是獨(dú)立存在的,有大量因素影響制約。其中影響最大的是技術(shù),其次可能是政策、道德等。
最后,我們在知識收集過程中,必定面臨一些困難。例如自身的知識洼地?zé)o法跨越,或是元素過多無法窮盡,我們需要應(yīng)用一些抽象、指代的方法來跨過這些障礙。
基于上述原則,形成我們的收集框架:
優(yōu)先梳理商業(yè)部分,并在遇到知識洼地時(shí)采用抽象要素、同理推斷、指代推斷等方法。
技術(shù)現(xiàn)狀決定當(dāng)前生意是否成立,技術(shù)潛力決定生意的上限天花板。作為重要支撐因素進(jìn)行分析。
限制因素如道德、政策、版權(quán)等,對主干不構(gòu)成影響,放到最次優(yōu)先級大概看看就行,對行業(yè)未來可能的限制稍作了解。導(dǎo)圖見下方:
對了,補(bǔ)充一下接下來這篇文章將只分析GPT是否能夠落地,不涉及AI繪畫,這是因?yàn)椋?/p>
1)我做不到
AI繪畫的材料我收集了,但是還未整理,后續(xù)會(huì)有一篇《AI產(chǎn)品經(jīng)理視角下的AI繪畫全解析》。我要等那篇文章寫完了,思路才會(huì)清晰,沒想清楚之前我就不亂說了。
2)其實(shí)也沒必要
兩項(xiàng)技術(shù)雖然都具備突破性,但目前ChatGPT的延伸方向、變革程度,都是遠(yuǎn)遠(yuǎn)高于Diffusion的,所以如果ChatGPT能論證成功,不用等AI繪畫,我們也可以推出標(biāo)題中的答案。
第三步(1):基于框架進(jìn)行知識填充——商業(yè)篇
我們先說盈利模式和成本控制兩部分,然后帶著相關(guān)認(rèn)知去盤點(diǎn)場景。
1. 盈利模式
互聯(lián)網(wǎng)主流盈利模式無非三種:
1)廣告/流量模式
通過免費(fèi)產(chǎn)品吸引用戶使用,促使用戶投注大量時(shí)長/頻率,再從中切割廣告流量從而盈利。在目前短視頻、中長視頻、游戲、小說的圍剿下,我不看好ChatGPT所創(chuàng)新的應(yīng)用能夠搶奪足夠份額的時(shí)長。邊角料的時(shí)長空間或許可以,但上限不夠大。
而且一旦涉及時(shí)長爭奪,我們所描述的肯定是C端娛樂應(yīng)用。對于有野心的玩家來說,是很難接受讓廣告突破用戶體驗(yàn)的。
不過小規(guī)模應(yīng)用其實(shí)可以考慮,特別對于獨(dú)立開發(fā)者來說,激勵(lì)廣告變現(xiàn)是一個(gè)很好的方式,雖然我手里沒有數(shù)據(jù),但AI繪畫在過去的半年內(nèi)已經(jīng)證明了可以實(shí)現(xiàn)收益打正。
AI繪畫暫時(shí)形成一條應(yīng)用-消費(fèi)的小市場,但上限很低
不過我感覺廣告模式應(yīng)該是最不適配的,除非技術(shù)再進(jìn)行突破,或出現(xiàn)意料外的殺手應(yīng)用。例如一個(gè)讓你愿意每天投入半小時(shí)進(jìn)行聊天,并且他放廣告你還不反感的虛擬人……這有可能嗎?
2)商品模式
商品模式是最傳統(tǒng)的,一手交錢一手交貨。只是這種模式下,交易是一次性的。2B端的定制開發(fā)服務(wù),游戲充值都可以用這種模式概括——當(dāng)然也包括賣實(shí)體商品。
但是商品模式最需要的是“復(fù)購動(dòng)力/頻率”,游戲充值有沉浸心流、社交貨幣、排行攀比等心理方法來推動(dòng),實(shí)體商品則來自現(xiàn)實(shí)生活的復(fù)雜需求。
Chat的應(yīng)用延伸,如果采用商品模式變現(xiàn),需要考慮幾點(diǎn):
- 是否可以延伸出豐富的商品——例如虛擬人物的劇本,不同的TTS音色,或者虛擬人物本身的購買。
- 這些商品的邊際成本如何,是否能控制到極低的程度?
- 這些商品用什么動(dòng)力來推動(dòng)復(fù)購?
B端會(huì)更明確一些,商品付費(fèi)基于明確價(jià)值。例如49.9元1000次SEO文案生成/社媒生成/廣告語生成。而C端提供的價(jià)值不那么商業(yè)實(shí)際,需要考慮其他動(dòng)力來刺激復(fù)購能想到的替代。例如宅男手辦、以及明星周邊/打榜。
3)訂閱模式
用戶周期性支付費(fèi)用,以獲取某種服務(wù)、特權(quán)、功能。這種模式最重要的在于,花錢訂閱的那個(gè)東西對用戶是否具備“持續(xù)價(jià)值”。
2B方向的產(chǎn)品,可以不用討論,訂閱模式已經(jīng)逐步替代商品模式成為最優(yōu)解。我們慢慢看到不管是軟件服務(wù)的定制開發(fā),還是本地應(yīng)用軟件的license機(jī)制越來越少,取而代之的是訂閱模式。畢竟訂閱模式能帶來更健康穩(wěn)定的現(xiàn)金流,這已經(jīng)是非常大的優(yōu)勢了。
而2C方向的產(chǎn)品,還充滿不確定性。比較經(jīng)典的如視頻會(huì)員VIP所代表的娛樂價(jià)值,交友APP代表的社會(huì)尊重價(jià)值,GTD代表的生產(chǎn)力價(jià)值,2C向的GPT產(chǎn)品能否像他們一樣創(chuàng)造足夠的“持續(xù)價(jià)值”,還需要先行者為我們踩坑。
上述三種盈利模式簡單了解即可,他們之間不是非此即彼的。例如百度云盤限速下載,你可以用訂閱來做,也可以用商品來做,嚴(yán)格來說沒有那么明確的界限,純粹看那種盈利方式在商業(yè)測算上能帶來更大的利潤。
但綜合來看,商品模式和訂閱模式和ChatGPT的延伸應(yīng)用會(huì)更為匹配。
2. 成本控制
成本可以分為三塊:
1)技術(shù)成本
GPT3.0的付費(fèi)接口是3700個(gè)字/元(經(jīng)過換算),這是最明確的成本線。除非等幾個(gè)月成本下降或國內(nèi)大廠跟進(jìn)做出服務(wù)開放,否則這個(gè)成本線會(huì)持續(xù)一段時(shí)間。
此外搭建相關(guān)服務(wù)、開發(fā)產(chǎn)品并維護(hù)也會(huì)產(chǎn)生費(fèi)用,根據(jù)落地的形式不同。
2)運(yùn)營成本
人力費(fèi)用一般而言是大頭。即使排除算法角色(是的,只做應(yīng)用層甚至可以不需要算法,所以這波技術(shù)浪潮對算法同學(xué)而言是非利好),那么也至少需要工程方向、前后端、產(chǎn)品設(shè)計(jì)等角色。
如果你是2B市場,還至少需要配備銷售團(tuán)隊(duì)。整體的上限浮動(dòng)空間非常大,從0人(獨(dú)立開發(fā)者)到幾十人都有可能。
另外還需要考慮辦公場地、器材購買、HR/行政等費(fèi)用,當(dāng)然你可以選擇全體遠(yuǎn)程協(xié)作+服務(wù)外包等多種方式去降低。上下浮動(dòng)空間也比較大。
3)增長成本
2B的增長成本來自PR費(fèi)用,參會(huì)費(fèi)用,以及銷售費(fèi)用。部分to 小B的例如給電商從業(yè)者的還會(huì)涉及廣告費(fèi)用。2C就更不用說了,除非運(yùn)氣好裂變了,不然買量是離不開的話題。
目前比較好的是這個(gè)方向比較新,競價(jià)價(jià)格會(huì)相對低。不過也存在蹭流量現(xiàn)象,例如完全沒有相關(guān)要素的社交APP,也會(huì)投放含有“虛擬聊天”相關(guān)的素材。
2C還有一個(gè)利好就是一般做娛樂類應(yīng)用,社交的買量價(jià)格起碼不像電商和金融那么恐怖。
帶著上述這些前置信息,我們會(huì)發(fā)現(xiàn),考慮場景的生意模式的時(shí)候,我們不可能只按3700字/元來作為底線測算。整體的成本線可能要壓到2000字甚至1000字/元,才能抹平其他成本。
即我們需要做到,GPT每生成1000個(gè)字,產(chǎn)品能從用戶身上賺到1元。這樣營收與成本線3700字/元之間的差額就是我們可累積的利潤。
3. 場景盤點(diǎn)
帶著對盈利模式和成本線的簡單了解,我們進(jìn)入場景盤點(diǎn)。
在這一部分我們要注意,我們沒有精力、也不可能將市面上全部的應(yīng)用羅列。因此只能基于技術(shù)線應(yīng)用可能進(jìn)行分類聚合,然后基于各類別的關(guān)鍵要素進(jìn)行分析。
4. 文本創(chuàng)作類
這是目前最火爆的一個(gè)分類。從文本長度來說,可以分為短文本、長文本、超長文本。從專業(yè)角度,可以分為法律、心理咨詢、教育、建筑、小說、公文等。再細(xì)致一點(diǎn)可以列出SEO文案、社媒內(nèi)容、廣告創(chuàng)意、郵件寫作、公文信函、簡歷修改等等等等。
我們不可能把全部的可能組合起來,其結(jié)果將超出我們的分析能力范圍。
我們只抓兩個(gè)關(guān)鍵要素:怎么賺錢,技術(shù)能否支撐。
在這里,舉兩個(gè)例子:
SEO文章生成:在AIGC之前,人工手寫的SEO稿是有明確標(biāo)價(jià)的,大約在千字10元~50元不等,個(gè)別優(yōu)質(zhì)的可以到100元。我們?nèi)∫粋€(gè)最低值,就是千字/10元,離我們前文硬推的千字/1元之間足足有10倍的價(jià)值差額。
電商運(yùn)營提效:我是一名在西班牙的電商從業(yè)者,原本我雇傭了一名本地運(yùn)營,幫助我維護(hù)西語系國家的站點(diǎn)?,F(xiàn)在通過AI的能力,仍然是這名運(yùn)營,可以在多個(gè)不同語系,數(shù)十個(gè)細(xì)分市場中維護(hù)站點(diǎn)。那么這中間的差額就來自1名運(yùn)營人員和N名運(yùn)營人員之間。
我們會(huì)發(fā)現(xiàn),他的模式本質(zhì)上是AI在內(nèi)容創(chuàng)作這項(xiàng)勞動(dòng)上,制造了剪刀差。只要這場浪潮沒有完全結(jié)束,內(nèi)容創(chuàng)作的社會(huì)必要?jiǎng)趧?dòng)時(shí)間沒有完全進(jìn)入另一個(gè)層面,剩余價(jià)值就會(huì)自動(dòng)從動(dòng)蕩的剪刀差中掉落。
而在技術(shù)層面而言,目前的技術(shù)支撐程度,簡單來說就是:文本越長死的越快,結(jié)構(gòu)越復(fù)雜死的越快,但短文本和通用內(nèi)容方面已經(jīng)是如魚得水,非常成熟。
不過目前已經(jīng)有人在中長文本方向進(jìn)行努力,他的推理能力也在加強(qiáng),所以技術(shù)的突破和垂直領(lǐng)域適應(yīng)是一個(gè)非常值得期待的方向。
綜上,我認(rèn)為,文本生成領(lǐng)域是一個(gè)完全的增量市場。并且隨著技術(shù)的進(jìn)一步提升,他的規(guī)模更逐步擴(kuò)大。補(bǔ)充:其實(shí)還有一些小分支領(lǐng)域,例如文本糾錯(cuò)、實(shí)時(shí)翻譯等,但是都不如文本生成夸張,所以就略過了。
5. 代碼生成/糾錯(cuò)/Sql/語言轉(zhuǎn)換等等等等
這是目前海外第二火爆的分類,獨(dú)立開發(fā)者很多。不過分析到這里我遇到一個(gè)尷尬的地方。我并不是程序員,無法設(shè)身處地去設(shè)想是否愿意為相關(guān)的服務(wù)付費(fèi)。
哈哈,所以我把問題轉(zhuǎn)手給我的程序媛夫人,讓她在旁邊靜靜思考一下。我們先從這個(gè)領(lǐng)域的技術(shù)情況開始分析。
首先,不要被媒體稿迷惑。就目前而言,GPT無法替代程序員。他的代碼生成能力,在常規(guī)問題上能夠正確,但是一旦你換一些變種,他就會(huì)給出看似正確其實(shí)離了大譜的答案。
這項(xiàng)技術(shù)的應(yīng)用前景,更多在于代碼輔助寫作,例如快速生成一個(gè)簡單模塊,對代碼進(jìn)行自動(dòng)Bug檢查,生成Sql語句、代碼解釋等等。但是都需要人工二次review,他能夠幫助你的主要在于快速的檢索、簡單代碼的快速寫作、自動(dòng)糾錯(cuò)等輔助功能。
并且這方面和文本生成領(lǐng)域不太像,技術(shù)角度產(chǎn)出的結(jié)果質(zhì)量還不夠高,不太能形成巨大的剪刀差。但目前的技術(shù)已經(jīng)實(shí)現(xiàn)了一定的效率提升,以及門檻降低。效率提升:有助于程序員們coding環(huán)節(jié)加快速度。門檻降低:門外漢已經(jīng)可以通過開發(fā)工具+GPT實(shí)現(xiàn)部分專業(yè)領(lǐng)域的簡單設(shè)計(jì)(例如Unity+GPT做游戲)。
好了,回到商業(yè)價(jià)值上,一段時(shí)間的思考后,程序媛老婆給出了堅(jiān)定的答復(fù)——“我們花這個(gè)錢干什么,當(dāng)然自己做一個(gè)啊?!蔽遥骸?.0???”
我有點(diǎn)不太相信,但是找了一圈這個(gè)領(lǐng)域的投融資情況,找不到太多的例子,只看到OpenAI有投資消息:一家代碼編輯,一家開發(fā)工具。但再往下細(xì)探就找不到任何相關(guān)消息了。
好吧,我只能認(rèn)為暫時(shí)而言,這方面的商業(yè)前景可能不太樂觀。2C側(cè)暫時(shí)相信老婆大人的判斷,應(yīng)該比較難創(chuàng)收;而2B側(cè)需要企業(yè)判定對自身內(nèi)部效率有幫助。而眾所周知,提效類的2B服務(wù),往往比不過營銷類這種能直接創(chuàng)收的服務(wù)……
綜上,這是一個(gè)完全的增量市場,但是商業(yè)化機(jī)會(huì)似乎不太美妙。比起有一個(gè)成熟公司在這里殺出來,我更期待獨(dú)立開發(fā)者或者是大廠做出的自用工具然后開源。畢竟——“當(dāng)然是自己做一個(gè)啊”真的是程序員獨(dú)有的浪漫了吧。
6. Chatbot方向
在說Chatbot方向前,我們先提煉新技術(shù)對這個(gè)領(lǐng)域的影響,然后帶著這些認(rèn)知去做場景盤點(diǎn)。
簡單而言,ChatGPT的技術(shù)讓對話更自然了。這里的自然包括純閑聊部分,也包括QA甚至Task任務(wù)。一個(gè)能夠聯(lián)系上下文,并對知識進(jìn)行整合推理的Chatbot,對以往的機(jī)器人會(huì)是一種顛覆式的升級,能夠跨越以往用戶體驗(yàn)的上限。
整體上,我將Chatbot分為以下方向:
1)客服類
這部分包括目前各個(gè)主流平臺自研的機(jī)器人或者提供相關(guān)服務(wù)的客服機(jī)器人企業(yè)。
從技術(shù)上來看,有非常大的變化,甚至推動(dòng)技術(shù)棧重構(gòu)。但是從商業(yè)上來看,有可能影響寥寥。
客服bot的市場中,仍然有一些競爭者,他不止ChatGPT,甚至連BERT也沒有應(yīng)用,仍然是相當(dāng)老舊的一套系統(tǒng)。而他們既然仍然在這個(gè)市場保有份額,自然有其原因——某些時(shí)候,2B的市場中,技術(shù)不是第一競爭力,服務(wù)、渠道、價(jià)格都會(huì)比技術(shù)重要。
而新一代語言模型技術(shù)的出現(xiàn),不過是給這個(gè)市場增加了一點(diǎn)擾動(dòng)。已經(jīng)買了產(chǎn)品的,因?yàn)檫w移成本,渠道關(guān)系不一定馬上會(huì)切換。技術(shù)服務(wù)商可能會(huì)緊急跟進(jìn)嘗試,但也不妨礙部分競爭者慢悠悠甚至毫不在意。
并且一個(gè)關(guān)鍵點(diǎn)在于,GPT技術(shù)除非自行部署,否則意味著自身的核心能力轉(zhuǎn)為依托于大廠。這是不是客服機(jī)器人公司所能接受的,還存在疑問。最后ChatGPT模式下,算力成本以及時(shí)延會(huì)變得難以忽視,會(huì)給這個(gè)方向帶來一些陰影。
綜上,我覺得客服方向,屬于舊技術(shù)盤踞的存量市場。技術(shù)蝶變在部分公司會(huì)狂風(fēng)暴雨(但落地會(huì)很謹(jǐn)慎),在部分公司可能進(jìn)展較慢或無動(dòng)于衷。
2)娛樂類
娛樂類即只提供情感/娛樂價(jià)值的方向,上篇文章提及的APP Glow 是一個(gè)典型例子。對于這個(gè)方向來說,技術(shù)上讓情感價(jià)值的提供成為現(xiàn)實(shí)(AI更自然了,沒那么智障了),但是非常需要結(jié)合情感場景的設(shè)計(jì)。
而脫離場景設(shè)計(jì)的結(jié)果,最典型的就是ChatGPT本身。ChatGPT當(dāng)時(shí)在11月30日發(fā)布后,用戶們是情不知所起,一往而深,再而衰,三而竭,僅僅一周左右的時(shí)間就銷聲匿跡。因?yàn)闆]有任何一個(gè)人的需求是“聊天”,以及看一個(gè)AI“賣弄聰明”。
在上篇文章中,我大概說了一些關(guān)于娛樂類Chatbot的一些想法,這里不再重復(fù)闡述這種方案的細(xì)節(jié)描述,沒看過的朋友可以移步此鏈接:輕松小補(bǔ)充:GTP APP全景地圖+虛擬人構(gòu)造想法+prompt模式詳解,看第二部分就行。
我們重點(diǎn)說說商業(yè)上的問題,先來回顧下上面提及的關(guān)鍵點(diǎn):
- 1000字/元的成本線;
- 基于訂閱收費(fèi)模式所需要的持續(xù)價(jià)值;
- 基于商品收費(fèi)模式所需要的復(fù)購動(dòng)力。
其中成本線問題需要通過產(chǎn)品設(shè)計(jì)繞開,不能讓用戶的行為時(shí)間大量投注在閑聊中,否則隨著文字互動(dòng)量的上升,成本將急劇飆升。
一種可能的解決的方式是以閑聊交互為核心行動(dòng)線,穿插劇本設(shè)計(jì)、劇情推動(dòng)、用戶自主人設(shè)構(gòu)建等玩法,來減少算力損耗——總之就是不要只能聊天,撐不住。
還有一種比較騷的玩法,可能是在Prompt層面對模型進(jìn)行約束,例如下面這張圖,ChatGPT會(huì)強(qiáng)制在問題中引入一段前綴,以此限制答案長度節(jié)約算力。
而持續(xù)價(jià)值和復(fù)購動(dòng)力可以合并來說,因?yàn)檫@兩種收費(fèi)模式其實(shí)很容易互相搖擺。一個(gè)比較好玩的做法可能是構(gòu)造“角色”的獲取-使用-厭倦-再獲取這種閉環(huán)。這套模式已經(jīng)被諸多集卡類游戲深度驗(yàn)證過,也成功從我手中掏走了不少錢(該死的原神?。。?。
綜上,我認(rèn)為娛樂類BOT是一個(gè)完全的增量市場,技術(shù)的突破成為這個(gè)方向的關(guān)鍵要素。但是市場強(qiáng)依賴對用戶需求的打磨和設(shè)計(jì),到底應(yīng)該怎么做,還需要摸索,目前大家都在嘗試。
3)工具類(助手類)
工具類包括語音音箱、手機(jī)語音助手、車載語音助手等。從技術(shù)上來看,我覺得非常大的問題在于“實(shí)時(shí)性”,我從圈內(nèi)朋友獲取的信息是,目前接口調(diào)用的時(shí)延在1S以上(不知道是不是因?yàn)榉?wù)器距離導(dǎo)致)。這種延遲很難說可以應(yīng)用在上述場景,他的用戶體驗(yàn)將十分糟糕。
除了這個(gè)缺陷以外,技術(shù)上對工具類BOT的體驗(yàn)提升將是非常大的幫助(上面說過了不再重復(fù)一遍了)。但從商業(yè)上來看,我認(rèn)為這也是一個(gè)舊市場。
或許你會(huì)認(rèn)為,可能有一家創(chuàng)業(yè)公司,依賴全新、更好體驗(yàn)的語音助手殺出重圍,擠占原有語音助手的空間。但需要我們注意的是,這些助手雖然是軟件,實(shí)際上卻非常依賴自身的硬件渠道——小愛依托小米,Siri依托蘋果,車載助手則在各個(gè)汽車品牌之間互相割裂。我感覺這個(gè)領(lǐng)域應(yīng)該是產(chǎn)生不了新蛋糕的。
不過比較有意思的是,雖然看起來和客服類一樣是個(gè)存量市場,但工具類Chatbot會(huì)熱衷于擁抱這些新技術(shù),因?yàn)檫@將有助于提升他們的用戶體驗(yàn),從而推動(dòng)他們硬件渠道的增長。綜上,我認(rèn)為工具類方向半舊不舊,沒有增量,但更樂于擁抱新技術(shù)。
4)專業(yè)類
專業(yè)類指需要獨(dú)特領(lǐng)域知識的Chatbot,例如法律咨詢機(jī)器人、投顧機(jī)器人、心理咨詢機(jī)器人等。
這類機(jī)器人有幾個(gè)特點(diǎn):第一,專業(yè)要求高,需要專業(yè)人員調(diào)教驗(yàn)證;第二,結(jié)果輸出要求穩(wěn)定/高質(zhì)量,需要為結(jié)果負(fù)責(zé);第三,部分場景使用頻率偏低(例如法律Chatbot,普通人一輩子用不到幾次);第四,極度需求高質(zhì)量專業(yè)數(shù)據(jù)。
從技術(shù)角度來說,GPT給他們帶來的升級效應(yīng)較小。因?yàn)檫@個(gè)領(lǐng)域最困難的并不是交互過程、理解過程的升級,他面臨的困難始終來自專業(yè)數(shù)據(jù),低頻場景。不知道GPT是否可能掛載額外的知識庫,而不需要專業(yè)數(shù)據(jù)在預(yù)訓(xùn)練環(huán)節(jié)重新接入。如果可以的話,應(yīng)該有助于提升用戶體驗(yàn)的上限。目前看到一個(gè)法律領(lǐng)域的BOT,如下圖:
在我一位律師朋友看來雖然還會(huì)有些錯(cuò)誤,但已經(jīng)相當(dāng)自然通順,相較過去基于舊技術(shù)的專業(yè)機(jī)器人已經(jīng)有一些提升。綜合來看,對當(dāng)前體驗(yàn)沒有顛覆性升級,場景低頻難以變現(xiàn)。
一條可靠的路徑可能是先做給專業(yè)人員的輔助工具,然后在使用中積累數(shù)據(jù)優(yōu)化再開放。我認(rèn)為他暫時(shí)是一個(gè)有一點(diǎn)潛力的增量市場,需要結(jié)合技術(shù)演進(jìn)和專業(yè)落地嘗試再細(xì)看。補(bǔ)充:專業(yè)領(lǐng)域太多了,非常需要行業(yè)經(jīng)驗(yàn)逐一盤點(diǎn),所以這段判斷僅供參考,存在較高錯(cuò)誤可能。
7. 游戲方向
頭部的應(yīng)用方向基本就是Chatbot、文本生成、代碼這三個(gè)領(lǐng)域,而游戲其實(shí)暫時(shí)我看不到太多優(yōu)秀的例子。這是我目前唯一找到的case:AI地下城,文字交互類游戲。但是我畢竟是20年+的游戲玩家,為愛發(fā)電也要強(qiáng)行聊一波:
1)NPC流水線
NPC制作的幾個(gè)制約因素都被本輪技術(shù)升級覆蓋。包括NPC背景故事的生成(短文本),NPC自由對話(基于人設(shè)的對話),NPC頭像、3D建模生成(頭像比較容易,3D建模有點(diǎn)困難,但NPC外貌重要性弱一些),NPC好感度機(jī)制等。其中自由對話模塊已有現(xiàn)成的case,一名玩家為《騎馬與砍殺2》制作了一段實(shí)驗(yàn)性demo,見下圖:
詢問NPC村民能否鑄劍,得到肯定回復(fù)并詢問預(yù)算及材料
2)任務(wù)流水線
任務(wù)制作的影響范圍相對較小,因?yàn)樗麜?huì)涉及到數(shù)值設(shè)計(jì)、關(guān)卡設(shè)計(jì)、上下游依賴任務(wù)等問題。但在單環(huán)任務(wù),一次性任務(wù)上,新技術(shù)將在任務(wù)文本生成,任務(wù)選項(xiàng)等方面起到幫助。這方面我勉強(qiáng)看到一個(gè)例子,不過他是劇情式游戲,僅供參考。
中間那個(gè)>You gogogo 就是我的命令,可惜寫這篇文章太累了,投不進(jìn)心思玩
3)交互模式
傳統(tǒng)的游戲交互方式是界面(傳統(tǒng)鍵鼠或觸控)、體感(Switch或VR),奇葩一點(diǎn)的可能會(huì)加入聲音觸控(音調(diào)、音量、或者少數(shù)ASR識別關(guān)鍵詞)。
而GPT可以讓自然語言交互成為可能,即延伸出來的文本交互&語音交互會(huì)相當(dāng)成熟。
但是并不是說更新的交互方式就一定更好,大家可以借鑒上一輪Chatbot的發(fā)展歷史來看。在Chatbot剛出的時(shí)候,極度追求極端的VUI交互(語音交互),但發(fā)展到后面都妥協(xié)了,采用VUI+GUI(圖形界面交互)的方式。這是因?yàn)檎Z音或文本,天然是有其缺陷的,需要根據(jù)實(shí)際需求選擇組裝。
具體內(nèi)容可以參見我2017年的一篇產(chǎn)出,現(xiàn)在回過頭看有一些更新的理解,不過我只剩個(gè)PDF了修改不了,就將就著看一看吧哈哈。
From《VUI設(shè)計(jì)方法分享》
不過游戲方向是非常特殊的,技術(shù)能夠?yàn)樗麕砀淖?,但他的成功絕不會(huì)只靠技術(shù)。事實(shí)上,全智能NPC、全智能任務(wù)只是一種新穎的設(shè)計(jì)。真正一款游戲好不好玩,能不能打動(dòng)人心,還有非常多題外的因素。
另外技術(shù)是否還能應(yīng)用到其他領(lǐng)域呢?例如NPC決策邏輯,世界背景構(gòu)建,新語言創(chuàng)造等——我不知道,但對技術(shù)永遠(yuǎn)抱有期待。希望綠洲早日來臨!為了部落,waaaaagh!
最后收尾總結(jié)一下:游戲領(lǐng)域是一個(gè)100%的舊市場,但又和客服機(jī)器人、工具機(jī)器人不一樣,新技術(shù)可能讓這個(gè)領(lǐng)域出現(xiàn)顛覆性的新玩家。補(bǔ)充:或許MUD類型游戲會(huì)重新閃亮出場?這種類型可以甩開音樂、UI、建模等諸多成本,最先吃到這波技術(shù)升級的紅利。利用好玩家們對新技術(shù)的新鮮感應(yīng)該會(huì)有一波流量,但后續(xù)留存就難說了。
8. 是否還有其他方向?
在上文列舉的文本生成、Chatbot、代碼生成,其實(shí)是ChatGPT演示中直觀帶給我們的靈感,只是在落地過程中,隨著參賽者的選擇,逐步延伸向了各自的細(xì)分方向。而游戲方向則是典型的,GPT技術(shù)+其他行業(yè)邏輯構(gòu)造出的延伸方向。因此我們可以想象類似游戲這樣的擴(kuò)展行業(yè)還有很多,只要他的行業(yè)中有大量關(guān)于文本的應(yīng)用——哪個(gè)行業(yè)不是呢?
例如教育行業(yè),能不能用GPT梳理、查找關(guān)聯(lián)知識點(diǎn)?金融行業(yè),能不能用GPT閱讀會(huì)計(jì)報(bào)告、合同文件進(jìn)行分析?我不知道哈哈,暫時(shí)沒有case,等待新玩家們涌現(xiàn)。
第三步(2)基于框架進(jìn)行知識填充——技術(shù)篇
技術(shù)篇非常簡單,我們不再科普技術(shù)原理,技術(shù)原理已經(jīng)在前文萬字長文:AI產(chǎn)品經(jīng)理視角的ChatGPT全解析中大篇幅講過了。我們重新基于應(yīng)用角度,梳理當(dāng)前技術(shù)的現(xiàn)狀及潛力。現(xiàn)狀決定短期內(nèi)哪些能做哪些不能做,潛力決定未來橫向、縱向的擴(kuò)展可能。大家可以用這些認(rèn)知來掃描任何新出現(xiàn)的應(yīng)用場景。
1. 技術(shù)現(xiàn)狀
1)結(jié)果不穩(wěn)定,需要review需要Review,就意味著大部分場景不能脫離人,只能輔助人。除非你在做一些完全不在乎質(zhì)只在乎量的市場,例如營銷號、SEO、刷評論。
2)推理能力弱,容易推出看似正確的錯(cuò)誤答案結(jié)構(gòu)復(fù)雜、邏輯復(fù)雜的場景無法適配,例如長篇小說容易顛三倒四,教育應(yīng)用也要謹(jǐn)慎用在理工科方向的問題上。
3)知識更新困難,成本巨大知識無法通過Prompt獲取,源頭只來自LLM中的1750億參數(shù),更新一次知識成本高,速度慢。所以無法適配需要緊跟時(shí)事的場景——但這不意味著不能用來摘要新聞,畢竟天底下無新鮮事。
4)延遲較高,實(shí)時(shí)場景不適配截止昨天2月3日我已知的信息是接口延遲在1~2S(可能有誤),所以暫時(shí)語音助手這種實(shí)時(shí)響應(yīng)要求高的會(huì)不適配。但我覺得這個(gè)問題應(yīng)該很快會(huì)被解決,工程問題無法求解是沒看到蛋糕,只要看到蛋糕性能迭代是非??斓模珹I的演進(jìn)歷史本身就是一部效率迭代的歷史。
5)垂直領(lǐng)域表現(xiàn)未達(dá)最佳這里的垂直領(lǐng)域包含兩種解釋,一種是技術(shù)側(cè)的垂直領(lǐng)域,例如自然語言理解類的任務(wù),暫時(shí)仍是BERT更優(yōu)。另一種是行業(yè)側(cè)的垂直領(lǐng)域,例如法律、心理、金融等。我猜想一個(gè)原因可能來自原始訓(xùn)練數(shù)據(jù)中缺乏高質(zhì)量的文本數(shù)據(jù)。
From《Language Models are Few-Shot Learners》模型預(yù)訓(xùn)練訓(xùn)練中所用到的數(shù)據(jù)集
6)可掛載其他模塊,但目前沒有標(biāo)準(zhǔn)方法目前看到的一些方式是,用GPT作為輸入端,再用其他工具作為邏輯端,例如GPT+unity,GPT+Wolfram | Alpha。
一方面是這些掛載目前都是自發(fā)行動(dòng)的,后續(xù)有可能會(huì)出現(xiàn)標(biāo)準(zhǔn)規(guī)范的GPT引用方式,甚至可能大部分應(yīng)用會(huì)以“本店支持GPT-3”做為榮譽(yù)標(biāo)識。另一方面我還沒看到更深層次、更觸碰GPT底層邏輯的實(shí)踐。
現(xiàn)在的實(shí)踐本質(zhì)上和ifttt有點(diǎn)像,是兩個(gè)應(yīng)用的解耦式聯(lián)合。是否能實(shí)現(xiàn)更深層次的呢?例如我們前面說的知識更新困難,有辦法通過掛載一個(gè)小規(guī)模的實(shí)時(shí)知識庫來實(shí)現(xiàn)嗎?不知道,等待玩家們的表現(xiàn)。
2. 技術(shù)潛力
1)更通用說白了就是從Text-Text到Text-everything。GPT已經(jīng)證明了在NLP領(lǐng)域的統(tǒng)治力,而圖像、語音、視頻等多模態(tài),其實(shí)只需要Text-多模塊的若干轉(zhuǎn)譯通路。我沒有針對性地搜集信息,但至少Text-image的通路是現(xiàn)成、成熟的。Stable Diffusion中一個(gè)關(guān)鍵技術(shù)就是OpenAI所提供的CLIP(Contrastive Language-Image Pre-Training)。
2)更便宜經(jīng)過商業(yè)模式部分的分析,我們可以相信這個(gè)方向的應(yīng)用潛力是巨大的。當(dāng)應(yīng)用可行時(shí),配套的上下游產(chǎn)業(yè)鏈會(huì)快速出現(xiàn),包括芯片、算法平臺、專屬云服務(wù)等等。不過前面就說了,上下游產(chǎn)業(yè)鏈不做分析,整個(gè)結(jié)果是不證自明的。我們只需要知道,按照邏輯推理,更便宜是100%會(huì)出現(xiàn)的就可以。
3)更強(qiáng)大一方面的提升來自于多種GPT方向大模型的嘗試落地。目前大廠們哪怕在短時(shí)間內(nèi)會(huì)與OpenAI展開合作,但除了微軟以外,應(yīng)該都無法忍受上游關(guān)鍵技術(shù)握在其他人手里。因此可預(yù)見的GPT的最上游會(huì)出現(xiàn)復(fù)數(shù)玩家來一起嘗試。
另一方面的提升來自模型結(jié)構(gòu)的改進(jìn),2023年學(xué)術(shù)界的關(guān)于這方面的paper肯定會(huì)爆炸的。唯一限制他們的就是學(xué)術(shù)界如何繞開大模型訓(xùn)練成本這一難關(guān)。應(yīng)該會(huì)形成企業(yè)-學(xué)術(shù)這樣的合作通道。最后一方面來自各種垂直方向的適配調(diào)優(yōu),前面在分析商業(yè)模式盤點(diǎn)場景的時(shí)候已經(jīng)舉了很多例子了。
第三步(3)基于框架進(jìn)行知識填充——限制篇
在國內(nèi)其實(shí)限制部分不用太快關(guān)注。畢竟我們現(xiàn)在是全面落后的狀態(tài),整體的趨勢肯定是先追趕,再監(jiān)管。反而海外因?yàn)镺penAI一枝獨(dú)秀,對相關(guān)方面的限制其實(shí)已經(jīng)初現(xiàn)波瀾。下面大概展開說說:
1. 道德方面
1)有害言論。訓(xùn)練數(shù)據(jù)質(zhì)量+模型不可控性導(dǎo)致AI的回答像一個(gè)定時(shí)炸彈。目前的優(yōu)化方式一方面是基于RLFH技術(shù)進(jìn)行針對模型的道德訓(xùn)練,另一方面是在答案輸入輸出時(shí)加裝敏感過濾器。
2)教育危機(jī)有一些美國大學(xué)封禁ChatGPT之類的新聞,事實(shí)上這不是一個(gè)噱頭。盡管模型的有很多缺點(diǎn),但至少在社科人文類上表現(xiàn)還不錯(cuò)。這個(gè)情況有點(diǎn)像當(dāng)初的“以圖搜題”,后續(xù)可能會(huì)有政策要求對這方面進(jìn)行限制。
3)內(nèi)容泛濫這個(gè)問題是在AI繪畫領(lǐng)域、虛擬人領(lǐng)域都出現(xiàn)過的。抖音、小紅書等平臺,已經(jīng)在限制基于AI繪畫的賬號。視頻號之前也禁止完全虛擬人直播,只允許中之人類虛擬人直播(現(xiàn)在還限不限不清楚)。本質(zhì)上這是每個(gè)內(nèi)容社區(qū)都會(huì)做的事情,內(nèi)容質(zhì)量和內(nèi)容數(shù)量之間,永遠(yuǎn)會(huì)傾向質(zhì)量。
但是對AI生成內(nèi)容的檢測,現(xiàn)在還沒有太好的方法。anti-spam這個(gè)領(lǐng)域如果不成功,以后的信息搜集將讓人絕望。感覺都可以看到營銷號改名機(jī)器號的那一天。
某平臺賬號限制說明
2. 技術(shù)代差/封鎖
1)技術(shù)代差在這方面我不是專家。但看大廠PR稿,全是樂觀,看技術(shù)大神的言論,全是焦慮,我也看不懂了。我還是相信大神們多一些,但也對國內(nèi)跟進(jìn)速度抱有期待。畢竟上一輪AlphaGo浪潮所代表的落后,最后也迎頭趕上了。
2)技術(shù)封鎖DDDD。
3. 政策、版權(quán)
有一個(gè)法規(guī):《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定》,我從里面找到了一些兩句相關(guān)的話,貼給大家參考一下:“發(fā)現(xiàn)未作顯著標(biāo)識的算法生成合成信息的,應(yīng)當(dāng)作出顯著標(biāo)識后,方可繼續(xù)傳輸”“不得生成合成虛假新聞信息”而版權(quán)方面目前沒有相關(guān)消息出來,炒得最多的還是AI繪畫領(lǐng)域,大家搜一搜就有新聞了,我就不多說。
重點(diǎn)說說GPT的版權(quán)問題。先跟我看下面這張圖:
模型訓(xùn)練的語言分布,中文5%左右
在ChatGPT的體驗(yàn)中,我們并沒有太發(fā)現(xiàn)他有摘抄、洗稿的痕跡。是否有一種可能是,他的原始素材中,中文占比僅為5%?
如果國內(nèi)基于中文語料重新訓(xùn)練屬于我們的GPT后,是否有導(dǎo)致AI直接抄襲語料中的答案,或者稍微洗稿后吐出?
這個(gè)答案只能等待國內(nèi)的GPT模型落地我們才能看到結(jié)論了。但如果基于這種猜測,中文高質(zhì)量語料會(huì)變得炙手可熱,比如知乎社區(qū)以及百度百科,另外人工標(biāo)注訓(xùn)練也可能會(huì)迎來一波春天。
第四步:推理出最終答案
經(jīng)過上面的知識填充,我們最終得到這樣一張圖:
我們接下來就要基于我們上述所有收集到的知識進(jìn)行判斷。而我的判斷結(jié)果也很簡單,就是開篇那個(gè)——“我相信他能夠成功落地,并且將是一個(gè)時(shí)代的開始”。當(dāng)然,會(huì)附帶一些小補(bǔ)充、小限制:小心舊技術(shù)市場,小心媒體詞語的迷惑,關(guān)注技術(shù)的更新等等。
是的,這一步就這么簡單哈哈。事實(shí)上做決策最難的永遠(yuǎn)是信息收集,當(dāng)擁有足夠信息時(shí),答案近在眼前——是的我說的就是拉普拉斯妖。我相信能看到這里的朋友,應(yīng)該心中也有自己的那份判斷了。
本文由@馬丁的面包屑 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于 CC0 協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
厲害了