對(duì) DeepSeek 和智能下半場的幾條判斷
DeepSeek的出現(xiàn)不僅引發(fā)了技術(shù)圈的廣泛關(guān)注,也標(biāo)志著AI行業(yè)正式進(jìn)入“智能下半場”。本文作者從多個(gè)角度深入分析了DeepSeek的技術(shù)突破、行業(yè)影響以及對(duì)未來智能發(fā)展的啟示。
從 24Q3 開始我們就一直在講 AI 的下半場,雖然 OpenAI o1 提出了 RL 敘事,但因?yàn)楦鞣N原因沒有破圈,DeepSeek R1 解了 RL 的謎題,推進(jìn)整個(gè)行業(yè)進(jìn)入了新范式,真正進(jìn)入智能下半場。
市場上關(guān)于 DeepSeek 是什么、為什么的討論已經(jīng)很多了,接下來更有價(jià)值討論是 AI race 要怎么 play ?把過去半個(gè)月的思考總結(jié)了一下,希望成為探索下半場的 road map,每隔一段時(shí)間來復(fù)盤
01 DeepSeek 超越 OpenAI 了嗎?
DeepSeek 超越了 Meta Llama 毫無疑問,但相比 OpenAI、Anthropic 和 Google 這些第一梯隊(duì) players 還有距離,比如 Gemini 2.0 Flash 成本比 DeepSeek 更低,能力也很強(qiáng),且全模態(tài),外界低估了 Gemini 2.0 為代表的第一梯隊(duì)的能力,只是沒有開源而獲得這么炸裂轟動(dòng)性的效果。
DeepSeek 很讓人興奮,但還不能稱作范式級(jí)創(chuàng)新,更準(zhǔn)確的表述是將之前 OpenAI o1 半遮半掩的范式開源,將整個(gè)生態(tài)推向很高滲透率。
從第一性原理角度,在 Transformer 這一代架構(gòu)下超越第一梯隊(duì)模型廠商是有難度的,同樣路徑下很難實(shí)現(xiàn)彎道超車可能,今天更期待有人能探索出下一代的智能架構(gòu)和范式。
DeepSeek 用一年時(shí)間追上了 OpenAI 和 Anthropic
02 DeepSeek 開啟新范式了嗎?
就像前面說的,嚴(yán)格意義上說,DeepSeek 沒有發(fā)明新范式。
但 DeepSeek 的重要意義在于幫助 RL 和 test time compute 這個(gè)新范式真正出圈。如果說 OpenAI 最初發(fā)布的 o1 是給行業(yè)出了一個(gè)謎語,DeepSeek 就是第一個(gè)公開解謎的人。
DeepSeek 發(fā)布 R1 和 R1-zero 之前,行業(yè)只有少部分人在實(shí)踐 RL 和 reasoning model,但 DeepSeek 給大家指明了路線圖,讓行業(yè)相信這樣做真的能提升智能,這對(duì)提升信心,吸引更多 AI researcher 轉(zhuǎn)向新范式的研究有巨大的幫助。
有人才進(jìn)入,才有算法創(chuàng)新,有開源緊追才有更多計(jì)算資源投入。在 DeepSeek 之后,原本計(jì)劃不再發(fā)新模型的 OpenAI 接連發(fā)出 o3mini,并計(jì)劃繼續(xù)發(fā)布 o3,還考慮開源模型。Anthropic 和 Google 也會(huì)加快 RL 的研究。行業(yè)對(duì)新范式的推進(jìn)因?yàn)?DeepSeek 加快,中小團(tuán)隊(duì)也可以在不同的 domain 上嘗試 RL。
另外,reasoning model 的提升會(huì)進(jìn)一步幫助 agent 落地,AI researcher 現(xiàn)在都因此對(duì) agent 的研究和探索更有信心,因此也可以說 DeepSeek 開源 reasoning model 推進(jìn)了行業(yè)向 Agent 的進(jìn)一步探索。
所以 DeepSeek 雖然沒有發(fā)明新范式,但推進(jìn)整個(gè)行業(yè)進(jìn)入了新范式。
03 Anthropic 的技術(shù)路線和 R1 有什么不同?
從 Dario的訪談可以看出,Anthropic對(duì)R-1/reasoning model的理解,與O系列有些分歧,Dario覺得 base model 與 reasoning model應(yīng)該是個(gè)連續(xù)光譜,而非 OpenAI 這種獨(dú)立的模型系列。如果只做 O 系列會(huì)很快遇到天花板。
我一直想為什么 Sonnet 3.5的coding、reasoning 和 agentic能力一下子提升這么強(qiáng),但 4o 一直沒追上?
他們?cè)?pre training base model 階段就做了大量 RL 工作,核心還是把 base model 提上去,不然只靠 RL 提升 reasoning model 可能很容易把收益吃光。
04 DeepSeek 的轟動(dòng)有必然,也有偶然
兩位早期 OpenAI 研究員寫的《為什么偉大不能被計(jì)劃》形容 DeepSeek 也很合適。
技術(shù)角度上,DeepSeek 有下面幾個(gè)亮點(diǎn):
? 開源:開源這點(diǎn)很重要,OpenAI 從 GPT-3 開始轉(zhuǎn)為閉源公司后,第一梯隊(duì)三巨頭就不再公開技術(shù)細(xì)節(jié),拱手讓出了一個(gè)空白的開源生態(tài)位,但 Meta 和 Mistral 并沒有接穩(wěn)這個(gè)位置,DeepSeek 這次堪稱奇襲,在開源這塊大賽道一馬平川。
如果把轟動(dòng)性打 100 分,智能提升貢獻(xiàn) 30 分,開源貢獻(xiàn) 70 分,之前 LLaMA 也開源但沒有這么轟動(dòng)的效果,說明 LLaMa 智能水平不夠。
? 便宜:“Your margin is my opportunity” 這句話的含金量還在上升。
? 聯(lián)網(wǎng)+公開 CoT:對(duì)于用戶這兩個(gè)點(diǎn)分別都能帶來很好的用戶體驗(yàn),DeepSeek 把兩張牌同時(shí)出了,可以說是王炸,給到 C 端用戶的體驗(yàn)和其他 Chatbot 完全不一樣。尤其是 CoT 透明,把模型思考過程公開了,透明能讓用戶對(duì) AI 更信任,促進(jìn)了破圈。不過,按理說 Perplexity 也是沖擊很大的,但 DeepSeek 服務(wù)端不穩(wěn)定,Perplexity 團(tuán)隊(duì)快速反應(yīng)上線了 R-1 反而承接了很大 DeepSeek R-1 溢出的用戶。
? RL 泛化:雖然 RL 是 OpenAI o1 最先提出來的,但因?yàn)楦鞣N運(yùn)營一直半遮半掩,滲透率并不高,DeepSeek R-1 很大意義推動(dòng)了 reasoning model 范式的進(jìn)程,生態(tài)接受度大幅提升。
DeepSeek 在技術(shù)上的探索投入是被這個(gè)智能成果值得更多人關(guān)注、討論的確定性因素,但 DeepSeek R1 推出的 timing 又讓這場轟動(dòng)帶有偶發(fā)性:
- 過去美國一直講自己在基礎(chǔ)技術(shù)研究上大幅領(lǐng)先,但 DeepSeek 原生于中國國內(nèi),這本身也是一個(gè)亮點(diǎn),這個(gè)過程中,又有很多美國科技大佬開始去宣揚(yáng) DeepSeek 挑戰(zhàn)了美國科技霸主的地位的論調(diào),DeepSeek 屬于被動(dòng)卷進(jìn)輿論戰(zhàn);
- DeepSeek R1 發(fā)布之前,OpenAI Stargate $500B 事件剛剛開始發(fā)酵,這種巨量投入和 DeepSeek 團(tuán)隊(duì)智能產(chǎn)出效率對(duì)比太鮮明了,很難不引發(fā)關(guān)注、討論;
- DeepSeek 讓英偉達(dá)股價(jià)大跌又進(jìn)一步讓輿論發(fā)酵,他們肯定也想不到自己成為了 2025 開年美股第一只黑天鵝;
- 春節(jié)是產(chǎn)品的練兵場,移動(dòng)互聯(lián)網(wǎng)時(shí)代很多超級(jí) App 都是在春節(jié)大爆發(fā)的,AI 時(shí)代也不例外。DeepSeek R1 恰好在春節(jié)前發(fā)布,大眾驚喜的是它的文字創(chuàng)作能力,而不是訓(xùn)練時(shí)候強(qiáng)調(diào)的 coding 和數(shù)學(xué)能力,文創(chuàng)更容易被大眾用戶有體感,也更容易 go viral。
05 誰受傷?誰受益?
可以把這個(gè)賽場上的 players 分 3 類:ToC、To Developer 以及 To Enterprise( to Government):
- ToC:Chatbot 肯定受沖擊最大,心智和品牌關(guān)注度被 DeepSeek 搶走了,ChatGPT 也不例外;
- 在開發(fā)者環(huán)節(jié)的影響很有限,我們看到有用戶用完之后說評(píng)論 r1 不好用不如 sonnet,Cursor 官方也說 Sonnet 還是 outperform,用戶 surprisingly 高比例都選擇 Sonnet,并沒有大幅遷移;
- 第三個(gè)維度,To Enterprise 和 To Government 的生意在于信任和需求理解,大型組織做決策的利益考慮很復(fù)雜,不會(huì)像 C 端用戶那么容易遷移。
再換個(gè)角度,從閉源、開源和算力的視角想這個(gè)問題:
短期大家會(huì)覺得閉源的 OpenAI/Anthropic/Google 更受沖擊:
- 技術(shù)神秘感被開源了,AI hype 里面最重要的神秘感的溢價(jià)被打破;
- 更現(xiàn)實(shí)的因素,市場認(rèn)為這幾家閉源公司的潛在客戶和市場規(guī)模被搶走了一些,GPU 投入的回本周期變長;
- 作為領(lǐng)頭羊的 OpenAI 在其中屬于最“吃虧”的那個(gè),之前想捂著技術(shù)不開源,半遮半掩,希望多賺技術(shù)溢價(jià)的美夢無法實(shí)現(xiàn)了。
但中長期看,GPU 資源充裕的公司還是受益的,一方面是第二梯隊(duì)的 Meta 可以快速跟進(jìn)新方法,Capex 更加 efficient,Meta 可能是很大受益者,另一方面是智能提升還需要更多探索,DeepSeek 開源把大家水平拉齊,進(jìn)入全新探索又需要 10 倍甚至更大量級(jí)的 GPU 投入。
從第一性原理來想,對(duì)于 AI 智能產(chǎn)業(yè)來說,無論是發(fā)展智能還是應(yīng)用智能,從物理本質(zhì)上就必然要消耗海量算力,這是基礎(chǔ)定律決定的,不是技術(shù)優(yōu)化能完全規(guī)避的。
所以,無論是探索智能,還是應(yīng)用智能,即便短期有質(zhì)疑,中長期的算力需求也會(huì)爆炸,這也解釋了為什么馬斯克從第一性原理出發(fā),xAI 堅(jiān)持?jǐn)U建集群,xAI 和 Stargate 背后的深層邏輯也許是一樣的。Amazon 等云廠商都宣布了要增加 Capex 指引。
我們就假設(shè)全球的 AI research 人才水平和認(rèn)知都拉齊,有更多 GPU 就可以做更多實(shí)驗(yàn)探索?最后可能還是回到 compute 的競爭。
DeepSeek 光腳不怕穿鞋,沒有商業(yè)化訴求,專注 AGI 智能技術(shù)探索,開源這個(gè)動(dòng)作對(duì)推動(dòng) AGI 進(jìn)程推動(dòng)意義很大,加劇了競爭,推動(dòng)了開放性,頗有鯰魚效應(yīng)。
06 蒸餾能超越 SOTA 嗎?
有個(gè)細(xì)節(jié)點(diǎn)不確定,如果 DeepSeek 從 pre train 階段就大量使用蒸餾的 CoT 數(shù)據(jù),那做到今天效果不算驚艷,還是在第一梯隊(duì)巨頭的肩膀上獲得的基礎(chǔ)智能,然后再開源出來;但如果 pre train 階段沒有大量用蒸餾數(shù)據(jù),DeepSeek 從 0 做 pre train 做到今天的效果,那就堪稱驚艷了。
另外,蒸餾能否在 base model 超越 SOTA,應(yīng)該是不太可能的。但 DeepSeek R-1 非常強(qiáng),猜測是 Reward model 做的非常好,如果 R-1 Zero 這條路徑靠譜,是有機(jī)會(huì)超越 SOTA。
07 No Moat !
Google 之前對(duì) OpenAI 的一個(gè)評(píng)價(jià):No Moat!這句話放在這里也很應(yīng)景。
DeepSeek 這一波 Chatbot 用戶又出現(xiàn)了大量遷移現(xiàn)象,給了市場一個(gè)很重要的啟發(fā):智能技術(shù)進(jìn)步非常陡峭,階段性產(chǎn)品很難形成絕對(duì)壁壘。
不管是 ChatGPT/Sonnet/Perplexity 剛形成了心智和口碑,還是 Cursor、Windsurf 這類開發(fā)者工具,一旦有了更智能的產(chǎn)品,用戶對(duì)“上一代”智能的產(chǎn)品毫無忠誠度,今天不管是模型層還是應(yīng)用層都很難構(gòu)建護(hù)城河。
DeepSeek 這次也驗(yàn)證了一件事:模型即應(yīng)用,DeepSeek 在產(chǎn)品形式上沒任何創(chuàng)新,核心就是智能+開源,我也不禁思考:在 AI 時(shí)代,任何產(chǎn)品和商業(yè)模式的創(chuàng)新都比不上智能的創(chuàng)新嗎?
08 DeepSeek 應(yīng)該承接這波 Chatbot 流量并做大嗎?
從 Chatbot 爆火到今天,通過 DeepSeek 團(tuán)隊(duì)的反應(yīng)可以明顯感覺出來,DeepSeek 還沒想好怎么用這波流量。
而要不要接住、并積極運(yùn)營這批流量這個(gè)問題的本質(zhì)是,偉大的商業(yè)公司和偉大的 research lab 能共存在一個(gè)組織嗎?
這件事非??简?yàn)精力和資源分配、組織能力和戰(zhàn)略選擇,如果是字節(jié)、Meta 這類大公司,他們的第一反應(yīng)應(yīng)該都要接下來,也有一定組織基礎(chǔ)可以接下來,但 DeepSeek 作為一個(gè) research lab 組織,承接這波巨量流量的壓力必然很大。
但同時(shí)也要想這一波 Chatbot 會(huì)是階段性流量嗎?Chatbot 是不是在未來智能探索的主線下?似乎感覺每個(gè)智能階段都有對(duì)應(yīng)的產(chǎn)品形態(tài),而 Chatbot 只是解鎖的其中一個(gè)早期形態(tài)。
對(duì)于 DeepSeek 來說,從未來 3-5 年視角看,如果今天不去承接 Chatbot 流量,會(huì)不會(huì)是一種 miss?萬一哪天跑出規(guī)模效應(yīng)?如果 AGI 最終實(shí)現(xiàn)了,又會(huì)是什么載體來承接?
09 下一個(gè)智能突破的 Aha moment 從哪來?
一方面,第一梯隊(duì)的下一代模型很關(guān)鍵,但今天我們又處在 Transformer 的極限邊界上,第一梯隊(duì)能否拿出代際提升的模型也不確定。OpenAI、Anthropic 和 Google 作為回應(yīng)發(fā)出來好 30-50%的模型可能都不夠挽回局勢,因?yàn)樗麄冑Y源多了 10-30 倍。
另一方面, Agent 落地比較關(guān)鍵,因?yàn)?Agent 需要做長距離多步驟推理,如果模型好 5-10%,領(lǐng)先的效果就會(huì)被放大很多倍,所以 OpenAI、Anthropic 和 Google 一方面要做 Agent 產(chǎn)品落地,full stack 集成模型+Agent 產(chǎn)品,就像 Windows+Office,二是也要 show 出來更強(qiáng)大的模型,比如 O3 完整版、Sonnet 4/3.5 opus 為代表的下一代模型。
在技術(shù)不確定性下,最寶貴的是天才 AI researchers,任何想要探索 AGI 的組織都要投入資源更激進(jìn)的 bet on next paradigm,尤其是在今天 pre training 階段已經(jīng)被拉齊的背景下,要有好的人才+充裕資源,探索下一個(gè)智能涌現(xiàn)的 Aha moment。
10 DeepSeek 這一波讓我對(duì)中國 AI 人才更有信心,非常鼓舞
最后,希望技術(shù)無國界。
作者:李廣密 編輯:penny,Siqi
本文由人人都是產(chǎn)品經(jīng)理作者【海外獨(dú)角獸】,微信公眾號(hào):【海外獨(dú)角獸】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于 CC0 協(xié)議。
看到一個(gè)說法R1走的不是獎(jiǎng)勵(lì)模型路線,是推演返回自行糾錯(cuò)的