大模型不需要眼前的共識

0 評論 914 瀏覽 3 收藏 17 分鐘

大模型領域還未能形成一致的市場共識,而這種“沒有共識”的狀態(tài),或許不算什么壞事。

確定性的機會指向的往往是需求場景,需要實干家,不斷優(yōu)化體驗;而不確定的機會往往依托于技術創(chuàng)新,需要冒險家,探索出一條通向應用的路徑。這也是為什么人們不會驚訝于雷軍下場造車的決心,卻很難完全相信楊植麟在月之暗面創(chuàng)業(yè)過程中表現(xiàn)出來的技術理想主義。

在大模型領域,并沒有形成像新能源車一樣的市場共識。企業(yè)在確定性和不確定性之間進行的權(quán)衡,是引發(fā)行業(yè)分歧的主要原因。選擇確定性還是擁抱不確定性,決定了企業(yè)是優(yōu)先賺到錢,還是優(yōu)先做好技術;是堅持做閉源大模型,還是賭開源大模型一定會迎頭趕上;是要依靠通用模型催生引爆行業(yè)的超級應用,還是要通過小模型先占領細分市場。

當前的環(huán)境下,企業(yè)和投資人都會從更現(xiàn)實的角度去做考量,活下去、掙到錢,比一個不確定的理想愿景更能說服人。但人們對大模型的期待是給行業(yè)帶來更徹底地改變。從長遠來看,現(xiàn)在很多企業(yè)的大模型應用,還是在對原有工具進行小修小補,很難產(chǎn)生引爆技術的應用,也很難抵御未來大模型技術迭代帶來的洗牌。

泛濫的「智能體」是最明顯的一個例子。國產(chǎn)大模型的落地催生出各種被冠以智能體名號的聊天機器人和「XX助手」。百度文心一言中充斥著大量伏地魔、繁花-爺叔這樣的模擬對話機器人;kimi+上也出現(xiàn)了公文筆桿子、i人嘴替等個人助理;字節(jié)豆包在抖音上的推廣也都依靠批改作業(yè)、練習英語口語等簡單的功能點來吸引用戶。

很難想象這樣的聊天機器人能有多強大的生命力。如果我們對于大模型的期待僅停留在追求確定性的階段——利用其提升智能客服的對話體驗,提高資料搜集整理的效率以及擴充某些圖像或生成某些代碼,那么大模型能夠產(chǎn)生的實際價值或?qū)⑦h不及我們現(xiàn)在的預期。

大模型殺手級應用的出現(xiàn)一定是要革掉某個現(xiàn)有體驗的命?,F(xiàn)在來看,沒有共識就是最好的消息,至少說明這個市場上,不是所有人都只滿足于眼前的利益,還有人在沿著另一條邏輯路線前行,在不確定中尋找更大的可能,去打一場持久戰(zhàn)。

一、大模型的兩種邏輯

中局和終局是大模型領域目前比較有代表性的兩種發(fā)展邏輯。

中局的邏輯以朱嘯虎(金沙江創(chuàng)投主管合伙人)為代表,包括一部分聚焦應用層的創(chuàng)業(yè)者在內(nèi),致力于利用開源大模型快速構(gòu)建服務于細分需求的小模型,然后通過數(shù)據(jù)積累和模型迭代,建立競爭門檻;終局的邏輯以月之暗面為代表,傾向繼續(xù)投入于大模型能力的提升,等待技術迭代引爆超級應用。

在中局的邏輯里,大模型的理解、決策能力被融合到既有的場景中,讓這些場景能夠應用大模型的生成能力,提升解決方案的性能,從而產(chǎn)生新的商業(yè)化可能性。這種邏輯受到青睞的原因是,有確定性需求,可以迅速見到成效,用戶付費意愿更強。

在朱嘯虎的介紹中,一家利用開源大模型做AI視頻面試的企業(yè)2023年的收入比2022年翻了一倍;利用開源大模型做AIGC視頻廣告的公司2023年收入做到了5000多萬元,比2022年漲了四五倍。

朱嘯虎追求的機會是,利用LLaMA這種快速提升的開源大模型,結(jié)合垂直場景的數(shù)據(jù)積累和人工微調(diào),在幾個月內(nèi)提升某一垂直場景的效率,在大模型發(fā)展過程中先賺到第一桶金。

朱嘯虎對大模型的發(fā)展持悲觀預期,對應用場景的開發(fā)保持樂觀,主張從實際出發(fā),把能賺的錢先賺到。

月之暗面的創(chuàng)始人楊植麟的理念則更具技術理想主義色彩,他相信大模型會逐步完成對世界的建模,并在這個過程中自然涌現(xiàn)出殺手級應用。

楊植麟的終局邏輯下,大模型是一種解釋世界的工具,就像人會用語言描述世界、理解世界一樣,大模型用數(shù)學為語言建模,讓AI也能夠理解世界,描述世界。AI依靠這種學習能力,逐步實現(xiàn)像人一樣使用工具,讓AGI成為幫助人鏈接和管理細分場景的「助理」。

AI能夠使用工具,也就意味著很多場景的運作方式將會迎來巨大改變??赡芷髽I(yè)未來并不需要有一個專門的視頻面試工具,也不需要有獨立的AI客服,而是統(tǒng)合到一個大模型主導的企業(yè)級智能體中,依靠智能體打通和掌控企業(yè)的不同環(huán)節(jié)。

在即將被OpenAI帶火的AI搜索中,真正的難點不是搜索結(jié)果到底要以網(wǎng)頁列表的形式顯示,還是以經(jīng)過AI整合的一段話來顯示,而是如何利用AI的理解能力,把被APP分解的信息重新鏈接成為一個整體。在Kimi+中,可以看到什么值得買、小紅書的相關內(nèi)容可以借助個人助理「什么值得買」和「美好生活指南」來進行喚醒。

但隨著楊植麟2個月套現(xiàn)4000萬美元的消息傳出,市場對他的這種終局邏輯產(chǎn)生了質(zhì)疑。月之暗面直接面向C端用戶的思路,獲客成本高且營收前景低。在沒有新的變化出現(xiàn)前,月之暗面商業(yè)化前景的不明朗被認為是楊植麟信心不足,急于套現(xiàn)的原因。

二、聊天機器人發(fā)揚不了大模型

從目前來看,國內(nèi)的大模型應用給到嘗鮮者的總體感覺還處于大而無當階段,提出問題之后獲得的答案很難讓人滿意。這一方面受限于大模型自身的技術能力不足,另一方面則受限于用戶對大模型應用使用經(jīng)驗的不足。

很多大模型應用推出之初,都僅有一個對話框,用戶可以在對話框中提出任何問題并獲得答案。而利用精準的Prompt充分開發(fā)大模型的現(xiàn)有能力,成為大部分用戶難以在短時間內(nèi)逾越的門檻。

目前充斥在文心一言、豆包等大模型應用中的智能體,很多都是為了降低大模型的使用門檻而打包的Prompt,也就是將一些用戶的使用經(jīng)驗沉淀為可以被分享的智能體,讓用戶可以按照需求找到不同的智能體,獲得更具針對性、更有效的回答。

Prompt門檻的出現(xiàn)本質(zhì)上還是大模型在語言理解能力上存在欠缺。用戶即便利用現(xiàn)成的Prompt獲得了有效信息,也依然要面對不成熟的體驗。Prompt或者所謂的智能體,可以解決初次溝通的效率問題,但解決不了復雜對話的效果問題,大模型應用往往都不止一輪對話。

這也是為什么智能體面向B端的商業(yè)化運作依然停留在客服、營銷領域,并沒有能推進到其他生產(chǎn)生活領域中。因為客服、營銷領域在大模型應用之前就已經(jīng)實現(xiàn)了基礎的智能對話體驗,大模型的理解能力可以讓互動變得更加靈活、自然。

從李彥宏(百度創(chuàng)始人)演講中提到的案例可以看到,百度在企業(yè)智能體方面的實踐是提供了一套結(jié)合大模型的無代碼客服機器人生成工具。企業(yè)可以上傳私域知識,自動形成對話語料,也可以過濾不在自己經(jīng)營范圍內(nèi)的內(nèi)容,還能關聯(lián)第三方的工具。

被包裝為智能體的客服機器人,會服務于百度的搜索生態(tài)。當用戶在百度APP搜索「什么時候去新加坡人最少」時,會在最前面顯示新加坡旅游局AI分身給到的答案,點擊可以進行更多對話。這種智能體本質(zhì)上和之前的百家號、小程序一樣,是百度為售賣搜索營銷、云服務等產(chǎn)品的新切入點。

但無論是to B的客服機器人,還是to C的各種Prompt,都不具備獨特性,很難成為大模型的引爆應用。現(xiàn)在呈現(xiàn)在用戶面前的智能體、大模型應用,都還是只停留在優(yōu)化工具的階段,只不過是讓搜索變得智能了一點。就像王小川(百川智能創(chuàng)始人兼首席執(zhí)行官)所說,是在聚焦于搜索如何使用大模型,而不是大模型如何學會用好搜索。

理想狀態(tài)下,智能體應該能夠調(diào)用工具,完成更為復雜的任務,而不僅僅是聊天。這里需要提到,無論Rabbit R1是否只是一個安卓App的套殼產(chǎn)品,但其結(jié)合大語言模型和所謂大動作模型對APP使用體驗的創(chuàng)造性升級,似乎更接近于一個智能體理想中的狀態(tài)——通過不斷學習理解人的復雜意圖,模仿人的動作執(zhí)行復雜操作。

我會比較贊同楊植麟所說的,技術是這個時代唯一新變量。無論是在to B還是to C場景中,在其他變量都沒有變的情況下,技術對語言的理解越來越精準,對人類意圖、行為的理解越來越精準,其能夠處理的任務就會越來越復雜,智能體的能力才會越來越強大。

Kimi的走紅,已經(jīng)證明大模型應用具備了被引爆的市場基礎。Kimi于2023年10月上線,2024年2月日活訪問量已經(jīng)在國內(nèi)排到前三,在3月將無損上下文長度從最初的20多萬字增加到200萬字后,Kimi關注度繼續(xù)走高,連續(xù)五次擴容,訪問量環(huán)比增長321.58%。

三、沒有共識就是最好的共識

當下還未解決的是,何時會出現(xiàn)一款讓大眾用戶保持高頻使用的超級應用。就大模型的應用現(xiàn)狀來看,國內(nèi)和國外都還處于工具優(yōu)化階段,只是取決于大模型不同的性能,效果上會有所不同。比如,Adobe對AI的最新應用仍聚焦于AI圖像編輯功能的創(chuàng)新和改進,文生圖功能的推出,以及視頻內(nèi)容的換頭、延長和輔助鏡頭的生成。

面向未來,讓大模型學會使用工具,而不依賴人工微調(diào),是技術發(fā)展的又一個節(jié)點。扎克伯格說,「對于Llama-3,當我們開始進入更多這些類似于智能體的行為時,我認為其中一些將是更多手工設計的。我們對Llama-4的目標將是將更多這樣的東西納入模型?!?/p>

最終能力的大幅提升,依然有賴于大模型本身的進步。但是,大模型的每一次進步,都需要耗費一筆相當龐大的資金。根據(jù)THE DECODER披露,GPT-4一次訓練成本為6300萬美元。而根據(jù)AI Index的估算,OpenAI的GPT-4估計使用了價值7800萬美元的計算資源進行訓練,谷歌的Gemini Ultra 的計算成本則高達1.91億美元。

高昂的訓練成本也是國內(nèi)在大模型方面沒有形成共識的原因之一。國內(nèi)大模型的融資額度要低于國外。月之暗面在2月獲得了10億美元A輪投資,Minimax3月被傳獲得6億美元戰(zhàn)略投資。相較于亞馬遜向Anthropic追加的27.5億美元投資,都不算多。而且國內(nèi)的環(huán)境并不利于大模型的進一步融資。

對大模型技術未來發(fā)展的差異化預期是另外一個原因。一部分開源大模型的支持者會認為,開源大模型與閉源大模型的發(fā)展會受到大模型技術發(fā)展坡度的影響,坡度越陡,閉源的優(yōu)勢越大,一旦坡度變緩,開源會很快追趕上來。

等待開源大模型追趕上來的人,都預期大模型技術發(fā)展的坡度會在短時間內(nèi)變緩。這樣閉源大模型與開源大模型的差距就會相對縮小。而提前深耕場景,積累了一定數(shù)據(jù)的企業(yè)則能夠利用開源大模型構(gòu)筑不低于閉源大模型企業(yè)的場景壁壘。

對于小企業(yè)而言,以應用場景為目標訓練小技能,然后不斷根據(jù)技術進步重新「練號」,可以在這個大技術趨勢下不斷抓到小風口,甚至在大風口到來時,以插件的形式參與其中。對于巨頭企業(yè)來說,其優(yōu)勢是多場景的融合,是對核心入口的爭搶,「重開新號」的代價太高,技術的迭代往往意味著一場淘汰賽的開啟。

基于融資能力的不同、對技術應用前景預期的不同、自身體量的不同,企業(yè)之間的共識并沒有形成。

這是一個好消息,說明大模型領域還遠未像新能源車一樣進入到市場成熟階段。雖然不確定性會增加失敗的風險,但其中也蘊藏著的機會也更大,足以說服一部分企業(yè)冒險前行,追求技術的高峰。

可以理解中局的無奈,卻不應放棄對終局的堅持。

本文由人人都是產(chǎn)品經(jīng)理作者【窄播】,微信公眾號:【窄播】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請關注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!