大模型降溫背后的難點(diǎn)、卡點(diǎn)、節(jié)點(diǎn)
大模型技術(shù)在2024年似乎遭遇了發(fā)展的瓶頸,資本市場(chǎng)對(duì)此概念的熱情降溫,消費(fèi)市場(chǎng)的新產(chǎn)品推出和更新速度減緩,民眾的關(guān)注度也隨之降低。盡管如此,大模型領(lǐng)域的競(jìng)爭(zhēng)依然激烈,特別是在價(jià)格和營(yíng)銷(xiāo)方面。本文深入探討了大模型技術(shù)發(fā)展中的難點(diǎn)、卡點(diǎn)和潛在的突破節(jié)點(diǎn)。
進(jìn)入2024年,大模型似乎有熄火之勢(shì):資本市場(chǎng),與之關(guān)聯(lián)的概念炒不動(dòng)了,英偉達(dá)股價(jià)動(dòng)輒暴跌重挫,引發(fā)“泡沫戳破”的擔(dān)憂(yōu);
消費(fèi)市場(chǎng),BATH們的推新活動(dòng)少了,產(chǎn)品更新迭代的速度慢了,民眾的關(guān)注度降了……
熱鬧的大概只剩下兩場(chǎng)酣仗:自5月15日字節(jié)跳動(dòng)宣布“以厘計(jì)費(fèi)”,打響國(guó)內(nèi)大模型“價(jià)格戰(zhàn)”的第一槍?zhuān)俣任男?、訊飛星火、阿里通義、騰訊元寶等紛紛跟進(jìn);
同時(shí),地鐵、寫(xiě)字樓、機(jī)場(chǎng)等白領(lǐng)人群密集區(qū)域,百度文心、訊飛星火、阿里通義、騰訊元寶、華為盤(pán)古的Slogan,你方唱罷我登臺(tái),貼臉營(yíng)銷(xiāo)如槍林刀樹(shù)。
“海水”與“火焰”交融的場(chǎng)面,不得不讓人思考,大模型的出路究竟在哪里?難點(diǎn)、卡點(diǎn)、節(jié)點(diǎn)又是什么?
一、難點(diǎn):盈利難&落地難
強(qiáng)如OpenAI,也面臨“恰飯”的難題。
援引外媒報(bào)道,OpenAI預(yù)估虧損50億美元,全年運(yùn)營(yíng)總成本高達(dá)85億美元,照此估算,其現(xiàn)金流大概率在一年內(nèi)耗盡。
而在一篇題為《How does OpenAI Survive》的長(zhǎng)文中,作者對(duì)OpenAI的商業(yè)模式產(chǎn)生了質(zhì)疑:
“OpenAI的營(yíng)收在35億至45億美元之間,但其運(yùn)營(yíng)虧損可能高達(dá)50億美元,其收入遠(yuǎn)遠(yuǎn)無(wú)法覆蓋成本。而為了推出下一代的大模型GPT5,OpenAI需要更多的數(shù)據(jù)和算力,這又是一大筆花費(fèi)?!?/p>
說(shuō)千道萬(wàn),靠著“碎鈔式”的大力出奇跡后,大模型卻仍未找到一條合理的盈利路徑。
據(jù)《節(jié)點(diǎn)財(cái)經(jīng)》觀察,市面上的大模型,大部分都采取To C+To B,即會(huì)員訂閱+開(kāi)發(fā)者API調(diào)用“兩條腿”走路。
但無(wú)論是To C,還是To C,能一上來(lái)就產(chǎn)生付費(fèi)的寥寥無(wú)幾,若再刨除重負(fù)的減項(xiàng),多半是鼻子大過(guò)臉。
以本土大模型先行者百度為例,2024年Q1,其云業(yè)務(wù)收入為47億元,同比增長(zhǎng)12%,其中6.9%來(lái)自外部客戶(hù)使用大模型及生成式AI相關(guān)服務(wù),約為3.24億元。
而在2023年Q4,大模型為百度云貢獻(xiàn)了6.6 億元增量收入。
這是國(guó)內(nèi)唯一披露大模型收益的廠商,本身又是家大業(yè)大,有底氣拼到底的巨擘。但只談創(chuàng)收,忽略創(chuàng)利,就是耍流氓。
可想而知,其余不敢明示賬目的選手,內(nèi)心有多迷茫、煎熬。
不掙錢(qián),難掙錢(qián)的背后,是大模型落地難的窘境。
雖然大佬們高呼“ChatGPT”的問(wèn)世是“iPhone時(shí)刻”,第四次工業(yè)革命,新一代的“火”和“電”,但坦率地講,當(dāng)下大模型還有很多局限性,包括認(rèn)知偏差、能動(dòng)性欠缺、泛化性能弱、幻覺(jué)等。
比如,數(shù)值運(yùn)算就是大模型明顯的弱項(xiàng),或者說(shuō)大模型是妥妥的“文科生”,做數(shù)學(xué)題的智商可能連二、三年級(jí)的小學(xué)生都不如。
《節(jié)點(diǎn)財(cái)經(jīng)》親測(cè),在Kimi輸入:“9.11和9.8哪個(gè)大?”一頓啰嗦后,Kimi給出了完全不正確的答案。
圖源:Kimi官網(wǎng)
比如,大模型資料更新不及時(shí),必須外掛知識(shí)庫(kù)才能在一定程度上緩解這個(gè)痛點(diǎn),并且還是無(wú)法完全解決“一本正經(jīng)地胡說(shuō)八道”的尷尬。
前幾天刷屏的SearchGPT,就在各地網(wǎng)友興致勃勃等待灰測(cè)展現(xiàn)AI搜索的“洪荒之力”時(shí),《大西洋月刊》澆了一盆冷水,眼尖的記者發(fā)現(xiàn):
問(wèn)的是關(guān)于“八月份北卡羅來(lái)納州的布恩音樂(lè)節(jié)”的細(xì)節(jié),SearchGPT的回答分為5條,3條里包含事實(shí)錯(cuò)誤——有的是把舉辦日期弄錯(cuò),有的是把距離和車(chē)程搞混,有的是把場(chǎng)館網(wǎng)址張冠李戴。
再如,大模型絕對(duì)是“健忘癥”患者,我們?cè)诤退鼘?duì)話(huà)時(shí),尤其是多輪對(duì)話(huà)時(shí),難免要化身“復(fù)讀機(jī)”,一遍一遍重復(fù)相同的話(huà)術(shù)。
而在B端,因?yàn)閷?shí)戰(zhàn)經(jīng)驗(yàn)不足,生分于對(duì)方的Know-How,加之環(huán)境的復(fù)雜多變性,大模型面臨的挑戰(zhàn)更艱巨。某業(yè)內(nèi)人士表示,迄今大模型在行業(yè)中尚沒(méi)有一個(gè)成熟的案例。
二、卡點(diǎn):數(shù)據(jù)、算力、成本
深入肌理地分析,大模型的“落地難”又與自身的三大卡點(diǎn):數(shù)據(jù)、算力、成本息息相連。
? 卡在數(shù)據(jù)
如果把大模型比作一頭巨獸,那它的顯著特征之一便是“不停進(jìn)食”:需要高質(zhì)量、大面積的語(yǔ)料做長(zhǎng)久期、高頻次地投喂、催肥。
換言之,“食物”的品質(zhì)、多寡、新鮮度、多樣性等,決定了大模型的迭代進(jìn)度和學(xué)習(xí)效果。
無(wú)疑,這對(duì)數(shù)據(jù)的挖掘、獲取提出嚴(yán)峻考驗(yàn),關(guān)系到各方的權(quán)益保障、利益分配、版權(quán)歸屬等,通常涉及到敏感信息時(shí),數(shù)據(jù)的清洗、標(biāo)注、脫敏又會(huì)很繁雜。
前陣,免費(fèi)網(wǎng)文APP番茄小說(shuō)因一份“AI協(xié)議”引發(fā)軒然大波。根據(jù)該份協(xié)議,平臺(tái)可以將簽約作品,含名稱(chēng)、大綱、簡(jiǎn)介、章節(jié)等,作為“哺育”AI大模型的素材,用于各種應(yīng)用場(chǎng)景,如智能對(duì)話(huà)、智能文本創(chuàng)作等。
不過(guò),這一舉動(dòng)遭到作者的普遍反對(duì),認(rèn)為其不僅威脅網(wǎng)絡(luò)寫(xiě)手的生計(jì),還損害了原創(chuàng)內(nèi)容的價(jià)值,甚至發(fā)起聯(lián)合斷更以示抗議。
? 卡在算力
如果把AI鏈路比作一間工廠,那么算力便是維持工廠運(yùn)轉(zhuǎn),量級(jí)夸張且進(jìn)價(jià)不菲的“燃料”(煤、石油、電力等)。
公開(kāi)資料顯示,初始ChatGPT匹配的算力是1萬(wàn)塊英偉達(dá)A100(AI芯片),花費(fèi)超過(guò)7億元。后續(xù)調(diào)優(yōu)每天消耗的算力大概是3640PFLOPS,即7至8個(gè)算力達(dá)500PFLOPS的Data Center的支撐,整體基建開(kāi)支以百億計(jì)。
按照廣發(fā)證券的測(cè)算,在暫不考慮軟件層面算法優(yōu)化的前提下,本土AI大模型在訓(xùn)練與判斷、預(yù)測(cè)階段所需算力,相當(dāng)于1.1萬(wàn)臺(tái)或3.8萬(wàn)臺(tái)(樂(lè)觀假設(shè)下)高端AI服務(wù)器,大致對(duì)應(yīng)約126億元到434億元的資金體量。
進(jìn)一步地,隨著大模型規(guī)模狀大,算力需求會(huì)倍數(shù)遞增,已然超越硬件的摩爾定律。據(jù)悉,ChatGPT從1.0到3.0,參數(shù)量從1.17億狂飆到1750億。
而目前,我們?cè)谒懔@塊既面臨外部“卡脖子”,內(nèi)部建設(shè)又相對(duì)落后,碎片化、傳輸慢、協(xié)同難、人才緊缺等“痼疾”亟待突破,導(dǎo)致大模型的實(shí)效遜于國(guó)外。
“大模型只有兩個(gè)梯隊(duì),OpenAI和Others,國(guó)產(chǎn)用哪家都一樣”,多位AI從業(yè)者談道。
? 卡在成本
大模型“桎梏”于算力,實(shí)際也是“桎梏”于成本。
計(jì)算機(jī)飛入千家萬(wàn)戶(hù),售價(jià)下探,變得親民、接地氣,很關(guān)鍵;智能手機(jī)能人手一部,物美價(jià)廉的小米功不可沒(méi);新能源汽車(chē)的熱賣(mài),離不開(kāi)動(dòng)力電池的“跳水式”降價(jià)……
從人類(lèi)歷史的進(jìn)程看,任何一項(xiàng)新技術(shù)的推廣、普及,都離不開(kāi)對(duì)成本的有效、大力壓縮、控制。
硬幣的背面,是科技發(fā)展和工業(yè)文明進(jìn)步共同作用下,制造效率、運(yùn)算精度提升,人均產(chǎn)值拔高,各類(lèi)物料愈發(fā)便宜等因素集結(jié)的強(qiáng)大驅(qū)動(dòng)力,進(jìn)而減輕C端、B端“太貴了,買(mǎi)還不買(mǎi)”的糾結(jié)。
大模型同理,浩大的開(kāi)支也是其成長(zhǎng)途中的“絆腳石”。試想,當(dāng)生態(tài)里只有唯一的“賣(mài)鏟人”(英偉達(dá))賺錢(qián),賺頭還不小,怎么可能持續(xù)呢?
好消息是,今年2月末,李彥宏透露,自發(fā)布以來(lái),百度不斷降低文心大模型在推理方面的成本,已降至去年3月版本的1%。
三、節(jié)點(diǎn):在產(chǎn)業(yè)里“種植”大模型
毋庸置疑,大模型仍有諸多“短板”和缺陷,但新技術(shù)的魅力向來(lái)在于探索“無(wú)人區(qū)”,跋涉“深水區(qū)”。
很多眼下看似微弱的“火種”,往往都孕育著日后“納須彌于芥子”的宏壯。盡管迄今為止的大模型,大家都是拿著錘子找釘子,但我們已經(jīng)看到,其正逐步向產(chǎn)業(yè)邁進(jìn),嘗試扮演了一些淺層的Agent的角色。
最醒目的標(biāo)識(shí)便是,大模型不再坐而論道,只會(huì)聊天、寫(xiě)詩(shī)、作畫(huà),而是起而動(dòng)之,走出實(shí)驗(yàn)室,去往礦區(qū)、政務(wù)、金融、醫(yī)藥、金融、物流等具體領(lǐng)域,努力兌現(xiàn)自己的終極使命。
比如,在礦區(qū),下井工人常年深陷光線(xiàn)昏暗、浮塵彌漫的環(huán)境,疊加經(jīng)年累月高強(qiáng)度的勞碌,使不少人都患上了風(fēng)濕、耳鳴等職業(yè)病,更甚者,還可能遭遇瓦斯、透水等意外,但礦區(qū)作業(yè)又十分依賴(lài)人力,特別是主運(yùn)系統(tǒng)巡檢。
華為的盤(pán)古礦山大模型這時(shí)候便派上用場(chǎng)了。其覆蓋煤礦的采、掘、機(jī)、運(yùn)、通、洗選等流程下的1000多個(gè)細(xì)分場(chǎng)景,用AI取代人成為主運(yùn)智能監(jiān)測(cè)系統(tǒng)的眼睛,能夠精準(zhǔn)識(shí)別大塊煤、錨桿等異常情況,異物識(shí)別準(zhǔn)確率達(dá)98%,動(dòng)作規(guī)范識(shí)別準(zhǔn)確率超過(guò)95%,且全時(shí)段巡邏助力工作人員,避免因漏檢造成的安全事故,縮短停機(jī)時(shí)間。
京東表示,基座大模型是靠卡訓(xùn)出來(lái)的,企業(yè)大模型是靠人用出來(lái)的。
物流領(lǐng)域,攬收、派送、分揀、輔助,應(yīng)對(duì)突發(fā)事件等,快遞員每天都背負(fù)著繁重的任務(wù),還要熟悉貨物處理規(guī)程、安全操作標(biāo)準(zhǔn)、客服要求等多達(dá)上百個(gè)規(guī)范,把這些統(tǒng)統(tǒng)記牢,肯定要耗費(fèi)大把功夫,還容易混淆。
京東言犀大模型的小哥終端助手大大化解了上述煩惱。它告別了只“動(dòng)腦”的境界,能直接“下手”,快遞員動(dòng)動(dòng)嘴,小哥終端助手就能立即將送貨通知發(fā)給客戶(hù)。如今,小哥終端助手為JD商城近35萬(wàn)自有配送員“效勞”。
再如,零售行業(yè),基于京東言犀大模型的AIGC營(yíng)銷(xiāo)工具“京點(diǎn)點(diǎn)”,不僅可以幫助商家一鍵出商品圖,還支持了超過(guò)2000種視覺(jué)元素道具;不僅可以豐富吸睛資源和表現(xiàn)力,還能依循商品屬性、特點(diǎn)和宣傳想要的個(gè)性化布局,實(shí)時(shí)、自主撰寫(xiě)創(chuàng)意賣(mài)點(diǎn)、種草文案、直播腳本等。
總的來(lái)說(shuō),把大模型“種植”在產(chǎn)業(yè)里,讓大模型在產(chǎn)業(yè)里生長(zhǎng)、發(fā)芽,儼然是現(xiàn)在大廠的共識(shí),必須攻克的難關(guān)。長(zhǎng)遠(yuǎn)看,該共識(shí)亦如“星星之火”終會(huì)燎原曠野。 寫(xiě)在最后
當(dāng)喧囂過(guò)后,大模型這場(chǎng)豪華游戲,能留在牌桌的玩家,注定只是少數(shù)。
面對(duì)數(shù)據(jù)、算力、成本等現(xiàn)實(shí)問(wèn)題,供需兩端漸漸回歸理性??梢灶A(yù)見(jiàn),在真“好用”和能“吸金”之間,大模型還有很長(zhǎng)的路要走。
作者:崔大寶
本文由人人都是產(chǎn)品經(jīng)理作者【節(jié)點(diǎn)財(cái)經(jīng)】,微信公眾號(hào):【節(jié)點(diǎn)財(cái)經(jīng)】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自Unsplash,基于 CC0 協(xié)議。
大模型技術(shù)在2024年似乎遭遇了發(fā)展的瓶頸,資本市場(chǎng)對(duì)此概念的熱情降溫,消費(fèi)市場(chǎng)的新產(chǎn)品推出和更新速度減緩,民眾的關(guān)注度也隨之降低。盡管如此,大模型領(lǐng)域的競(jìng)爭(zhēng)依然激烈,特別是在價(jià)格和營(yíng)銷(xiāo)方面。這篇文深入探討了大模型技術(shù)發(fā)展中的難點(diǎn)、卡點(diǎn)和潛在的突破節(jié)點(diǎn),對(duì)我很有幫助和啟發(fā)。