無論好壞,“推理”人工智能模型已成為一種趨勢(shì)
“推理 AI 模型興起,前景機(jī)遇挑戰(zhàn)并存?!?在人工智能領(lǐng)域,推理模型成為新趨勢(shì)。它們究竟為何備受關(guān)注?又面臨著哪些困境與爭(zhēng)議?未來發(fā)展之路在何方?
推理模型讓AI走得更遠(yuǎn),但它的成本卻讓人望而卻步。
在OpenAI發(fā)布其所謂的推理模型o1之后,來自競(jìng)爭(zhēng)對(duì)手AI實(shí)驗(yàn)室的推理模型如雨后春筍般涌現(xiàn)。
今年11月初,由量化交易員資助的AI研究公司DeepSeek發(fā)布了其首個(gè)推理算法DeepSeek-R1的預(yù)覽。同月,阿里巴巴的Qwen團(tuán)隊(duì)也推出了他們聲稱是首個(gè)“開放”版的o1挑戰(zhàn)者。
那么,是什么引發(fā)了這一波浪潮呢?其中一個(gè)原因,是尋找創(chuàng)新的方法來優(yōu)化生成型AI技術(shù)。正如我的同事Max Zeff最近報(bào)道的那樣,“暴力破解”式的技術(shù),雖然曾經(jīng)幫助模型規(guī)?;〉眠M(jìn)展,但如今已經(jīng)無法帶來過去那樣的提升。
AI公司面臨著激烈的競(jìng)爭(zhēng)壓力,必須保持當(dāng)前創(chuàng)新的步伐。根據(jù)估算,全球AI市場(chǎng)在2023年已達(dá)到1966.3億美元,預(yù)計(jì)到2030年將增至1.81萬億美元。
OpenAI表示,推理模型能夠“解決比以前更難的問題”,并代表了生成式AI發(fā)展的一個(gè)重大進(jìn)步。但并不是每個(gè)人都確信推理模型是未來發(fā)展的最佳路徑。
卡內(nèi)基梅隆大學(xué)的機(jī)器學(xué)習(xí)副教授阿米特·塔爾沃卡(Ameet Talwalkar)表示,他對(duì)首批推理模型感到“相當(dāng)印象深刻”。但他也同時(shí)提到,他“會(huì)質(zhì)疑那些堅(jiān)定聲稱知道推理模型會(huì)將行業(yè)帶向何方的人”。
塔爾沃卡說:“AI公司有財(cái)務(wù)動(dòng)機(jī)去描繪他們技術(shù)未來版本的光明前景。我們面臨的風(fēng)險(xiǎn)是,過于狹隘地關(guān)注單一范式,這就是為什么更廣泛的AI研究社區(qū)必須避免盲目相信這些公司所宣揚(yáng)的炒作和市場(chǎng)營(yíng)銷,而是應(yīng)該聚焦于切實(shí)的結(jié)果?!?/p>
推理模型的兩個(gè)主要缺點(diǎn)是:一是成本高,二是能耗大。
以O(shè)penAI的API為例,使用其推理模型o1,OpenAI收費(fèi)每分析約75萬字為15美元,每生成約75萬字為60美元。這是OpenAI最新的“非推理”模型GPT-4o的3到4倍費(fèi)用。
o1可以在OpenAI的AI驅(qū)動(dòng)聊天平臺(tái)ChatGPT上免費(fèi)使用,但有使用限制。然而,OpenAI本月早些時(shí)候推出了一個(gè)更高級(jí)的o1版本——o1 Pro模式,年費(fèi)高達(dá)2400美元。
加利福尼亞大學(xué)洛杉磯分校計(jì)算機(jī)科學(xué)教授蓋伊·范登布羅克(Guy Van Den Broeck)告訴 TechCrunch:“大型語(yǔ)言模型推理的總體成本肯定不會(huì)下降?!?/p>
推理模型成本如此高的一個(gè)原因是,它們?cè)谶\(yùn)行時(shí)需要大量的計(jì)算資源。與大多數(shù)AI不同,o1和其他推理模型在生成內(nèi)容時(shí)會(huì)進(jìn)行自我檢查,這幫助它們避免了通常困擾其他模型的陷阱。然而,這種自我驗(yàn)證也意味著它們往往需要更長(zhǎng)的時(shí)間來得出結(jié)論。
OpenAI預(yù)計(jì),未來的推理模型將“思考”數(shù)小時(shí)、數(shù)天甚至數(shù)周。盡管使用成本會(huì)更高,OpenAI承認(rèn),但這些推理模型可能帶來的突破性成果,從新型電池到新型癌癥藥物很可能是值得的。
然而,今天的推理模型在價(jià)值上并不那么顯而易見。非營(yíng)利組織Ai2的研究員兼機(jī)器學(xué)習(xí)工程師Costa Huang指出,o1并不是一個(gè)非常可靠的計(jì)算器。社交媒體上的簡(jiǎn)單搜索也能找到許多o1 Pro模式的錯(cuò)誤。
“這些推理模型是專門化的,可能在一般領(lǐng)域表現(xiàn)不佳,”Costa Huang告訴《TechCrunch》?!耙恍┫拗茣?huì)比其他限制更早被克服?!?/p>
蓋伊·范登布羅克認(rèn)為,推理模型并沒有真正進(jìn)行推理,因此它們能成功解決的任務(wù)類型也有限。他表示:“真正的推理適用于所有問題,而不僅僅是那些在模型訓(xùn)練數(shù)據(jù)中可能出現(xiàn)的問題。這個(gè)挑戰(zhàn)仍然是我們必須克服的主要問題。”
考慮到市場(chǎng)上強(qiáng)烈的動(dòng)力推動(dòng)推理模型的發(fā)展,我們可以合理推測(cè)它們會(huì)隨著時(shí)間的推移不斷改進(jìn)。畢竟,不僅僅是OpenAI、DeepSeek和阿里巴巴在投資這一新興的AI研究領(lǐng)域,風(fēng)險(xiǎn)投資家和來自相關(guān)行業(yè)的創(chuàng)始人也在聚集,共同展望一個(gè)由推理AI主導(dǎo)的未來。
然而,塔爾沃卡擔(dān)心,大型實(shí)驗(yàn)室可能會(huì)“把控”這些進(jìn)展。
“大型實(shí)驗(yàn)室出于競(jìng)爭(zhēng)原因保持保密是可以理解的,但這種不透明性嚴(yán)重妨礙了研究社區(qū)與這些想法的互動(dòng),”他說。“隨著越來越多的人朝這個(gè)方向努力,我預(yù)計(jì)[推理模型]將迅速發(fā)展。不過,雖然有些想法將來自學(xué)術(shù)界,鑒于此領(lǐng)域的經(jīng)濟(jì)激勵(lì),我預(yù)計(jì)大多數(shù)(如果不是全部)模型將由 OpenAI 等大型工業(yè)實(shí)驗(yàn)室提供。”(TechCrunch)
本文由人人都是產(chǎn)品經(jīng)理作者【AI新智能】,微信公眾號(hào):【AI新智能】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于 CC0 協(xié)議。
- 目前還沒評(píng)論,等你發(fā)揮!