DeepSeek,是如何開啟「AI 的安卓時(shí)刻」的?

0 評(píng)論 1225 瀏覽 2 收藏 20 分鐘

在 AI 發(fā)展進(jìn)程中,DeepSeek 為何能掀起如此波瀾?其開啟的 “AI 的安卓時(shí)刻” 又將給全球 AI 產(chǎn)業(yè)格局帶來哪些深遠(yuǎn)影響?這篇文章,我們看看作者的分析。

一個(gè)最直接的證據(jù)是,DeepSeek 正在以前所未有的速度,迅速擴(kuò)大它在全球范圍內(nèi)的生態(tài)圈——尤其是在中國(guó)。2025 年 1 月底,在 DeepSeek 所引發(fā)的重大行業(yè)關(guān)注和超級(jí)輿論風(fēng)暴下,美國(guó)三大科技巨頭英偉達(dá)、微軟、亞馬遜先后宣布接入旗下服務(wù)到 DeepSeek。

以此為起點(diǎn),DeepSeek 在中國(guó)已經(jīng)掀起了一場(chǎng)聲勢(shì)浩大的 DeepSeek 生態(tài)擴(kuò)張運(yùn)動(dòng)。

實(shí)際上,進(jìn)入到 2 月份,包括華為、百度、騰訊、阿里、京東、字節(jié)(火山引擎)等云計(jì)算大廠,都先后在 2 月份宣布接入到 DeepSeek。與此同時(shí),包括芯片、操作系統(tǒng)、算力設(shè)備等在內(nèi)的眾多行業(yè),也紛紛瞄準(zhǔn) DeepSeek 進(jìn)行相應(yīng)的適配或接入,大有爭(zhēng)先恐后之勢(shì)。

更令人關(guān)注的是,除了 DeepSeek 官方和官方 App 已經(jīng)開放的 C 端個(gè)人用戶服務(wù),不少與 C 端客戶關(guān)系密切的領(lǐng)域也已經(jīng)接入到 DeepSeek……

截至到 2 月 10 日,吉利、極氪、嵐圖、智己、寶駿、零跑、長(zhǎng)城、深藍(lán)、奇瑞等一眾車企的智能座艙已經(jīng)宣布接入到 DeepSeek。

甚至連華為、榮耀、OPPO、vivo、魅族這樣的智能手機(jī)廠商,也都官宣接入到 DeepSeek。

DeepSeek 生態(tài)擴(kuò)張的速度如此迅猛,聲勢(shì)如此浩大,影響如此廣泛——以至于在這樣的時(shí)間節(jié)點(diǎn),這個(gè)問題依舊值得反復(fù)思考:DeepSeek 的爆火,究竟意味著什么?

并非 0-1 創(chuàng)新,但足以震撼世界自 DeepSeek-V3 大模型和 DeepSeek R1 推理模型相繼在 2024 年底和 2025 年年初發(fā)布以來,DeepSeek 已經(jīng)贏得了眾多國(guó)內(nèi)外技術(shù)人士和商業(yè)人物的高度評(píng)價(jià)。也早已經(jīng)破圈到地緣政治的范疇,引發(fā)全球輿論關(guān)注和討論。不過在眾多的討論者中,《黑神話·悟空》出品方游戲科學(xué)的創(chuàng)始人兼 CEO 馮驥對(duì)于 DeepSeek 的評(píng)價(jià)最為令人注目,他表示:DeepSeek,可能是個(gè)國(guó)運(yùn)級(jí)別的科技成果。

在馮驥給出的關(guān)于 DeepSeek 中,強(qiáng)大和便宜是排名前兩位的標(biāo)簽。其中的強(qiáng)大,指的是 DeepSeek-R1 擁有比肩 OpenAI-o1 的推理能力。

而便宜,則是指它的訓(xùn)練成本。按照 DeepSeek 官方在開源論文中給出的實(shí)際描述,DeepSeek-V3 的訓(xùn)練成本僅為 500 多萬(wàn)美元,比 OpenAI 少了不止一個(gè)數(shù)量級(jí)。

不過需要明確的是,DeepSeek 并不是從 0 到 1 的創(chuàng)新。

如果從大模型底層算法的角度去追溯,DeepSeek 推出的一系列模型,還是基于 Google 在 2017 年提出的 Transformer 架構(gòu)來實(shí)現(xiàn)——這一點(diǎn)與 OpenAI 的 GPT 系列模型是一致的。但不同之處在于,在具體的實(shí)現(xiàn)路徑上,DeepSeek 進(jìn)行了一系列的算法和工程創(chuàng)新。

具體來說,DeepSeek 采用了 MoE 專家模型(有意思的是,MoE 專家模型也是由 Google 率先提出)、低秩注意力機(jī)制、強(qiáng)化學(xué)習(xí)、小模型蒸餾、FP8 混合精度等工程創(chuàng)新,并由此低得多的成本實(shí)現(xiàn)了類似于 OpenAI-o1 的成果。

以強(qiáng)化學(xué)習(xí)為例,根據(jù)面壁智能聯(lián)合創(chuàng)始人兼首席科學(xué)家劉知遠(yuǎn)的說法,DeepSeek 可能是全球首個(gè)能通過純粹的強(qiáng)化學(xué)習(xí)技術(shù)復(fù)現(xiàn) OpenAI-o1 能力的團(tuán)隊(duì),并且還把這種能力開源了。

他表示,DeepSeek-R1 創(chuàng)造性地基于 DeepSeek V3 這個(gè)基座模型,通過大規(guī)模強(qiáng)化學(xué)習(xí)技術(shù),得到了一個(gè)純粹通過強(qiáng)化學(xué)習(xí)增強(qiáng)的強(qiáng)推理模型,即 DeepSeek-R1-Zero,這具有非常重要的價(jià)值。因?yàn)樵跉v史上幾乎沒有團(tuán)隊(duì)能夠成功地將強(qiáng)化學(xué)習(xí)技術(shù)很好地應(yīng)用于大規(guī)模模型上,并實(shí)現(xiàn)大規(guī)模訓(xùn)練。

不僅如此,DeepSeek-R1 所采用的強(qiáng)化學(xué)習(xí)技術(shù),不僅局限于數(shù)學(xué)、算法代碼等容易提供獎(jiǎng)勵(lì)信號(hào)的領(lǐng)域,還能創(chuàng)造性地將強(qiáng)化學(xué)習(xí)帶來的強(qiáng)推理能力泛化到其他領(lǐng)域;比如說用戶在體驗(yàn) DeepSeek 的寫作能力,能夠很容易感受到其強(qiáng)大的深度思考能力。

實(shí)際上,DeepSeek 在創(chuàng)新過程中,所采用的眾多算法方案,并非是百分之百原創(chuàng)而來,其中不少還是基于類似于 Google、微軟這樣的美國(guó) AI 企業(yè)和 AI 學(xué)者提出的相關(guān)理論進(jìn)行工程落地。但是,以實(shí)現(xiàn)接近 OpenAI-o1 的能力為目標(biāo),能夠?qū)⑾嚓P(guān)論文和理論進(jìn)行工程落地,找到正確的路徑并最終取得成功,這本身就是非常極為困難的事情——即使是 AI 技術(shù)大牛云集的美國(guó) AI 相關(guān)企業(yè),也沒能實(shí)現(xiàn)。

但這一次,來自中國(guó)的 DeepSeek 實(shí)現(xiàn)了。

就連諾貝爾獎(jiǎng)得主、AlphaGo 之父、Google 旗下 DeepMind CEO Demis Hassabis 也承認(rèn),DeepSeek 可能是他「見到過的來自中國(guó)的最好的作品」,它展示了出色的工程能力。

可以說,盡管并非是完全原創(chuàng),但是 DeepSeek-V3 和 DeepSeek-R1 本身,已經(jīng)體現(xiàn)出了 DeepSeek 在算法架構(gòu)和工程實(shí)現(xiàn)上的系統(tǒng)級(jí)創(chuàng)新能力——就算不是從 0 到 1,也完全可以說是從 0.X 到 1 了。而這種能力,毫無(wú)疑問是世界級(jí)的。

所以,如果從理性的角度來看待,DeepSeek 成功的本質(zhì),是一群中國(guó)技術(shù)人員基于全球人工智能發(fā)展的智力和技術(shù)成果進(jìn)行系統(tǒng)級(jí)工程落地創(chuàng)新的成果,也是由中國(guó)企業(yè)在 AI 全球化的土壤上培育出的美味果實(shí)——這當(dāng)然值得慶賀。畢竟,在以往的類似于互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)的這樣的技術(shù)和商業(yè)浪潮中,往往是美國(guó)人扮演從 0 到 1 的技術(shù)創(chuàng)新角色,而中國(guó)人則更善于在應(yīng)用端進(jìn)行從 1 到 100 的推廣普及。但在從人工智能到 AGI 這一波技術(shù)浪潮的發(fā)展中,DeepSeek 開始由下及上,動(dòng)搖美國(guó)在 AI 技術(shù)領(lǐng)域的絕對(duì)原創(chuàng)優(yōu)勢(shì)。

更何況,DeepSeek 還采用了一個(gè)商業(yè)層面的絕對(duì)殺招:開源。

就連 DeepSeek 的對(duì)手,也在擁抱它由于 DeepSeek 本身所采用的開源模式。

自從 DeepSeek-R1 發(fā)布以來,在全球科技圈,已經(jīng)掀起了一場(chǎng)史無(wú)前例的擁抱 DeepSeek 浪潮。

讓人沒想到的是,率先擁抱 DeepSeek 的是 OpenAI 的背后大金主——微軟。

2025 年 1 月 29 日,微軟宣布 DeepSeek-R1 已經(jīng)在微軟的 AI 平臺(tái) Azure AI Foundry 和 GitHub 可用,開發(fā)者可以用新模型進(jìn)行測(cè)試和構(gòu)建基于云的應(yīng)用程序和服務(wù)。

隨后在 1 月 30 日,亞馬遜也表示 DeepSeek-R1 模型可以在 Amazon Web Services 上使用;同一天英偉達(dá)宣布 NVIDIA NIM 已經(jīng)可以使用 DeepSeek-R1 模型。

這三家美國(guó)科技巨頭前后接入 DeepSeek,不僅僅是對(duì) DeepSeek 的高度認(rèn)可和有效背書,也由此引發(fā)國(guó)內(nèi)云計(jì)算市場(chǎng)全面擁抱 DeepSeek 的熱潮。

來看一下具體的時(shí)間線:

  • 2 月 1 日,華為云宣布,硅基流動(dòng)和華為云團(tuán)隊(duì)聯(lián)合首發(fā)并上線基于華為云昇騰云服務(wù)的 DeepSeek R1/V3 推理服務(wù)。
  • 2 月 2 日,騰訊云宣布,DeepSeek 全系模型一鍵部署,包括「滿血版」 671B 參數(shù)到輕量版 1.5B 參數(shù)都包括在內(nèi)。
  • 2 月 3 日,百度智能云宣布,百度智能云千帆平臺(tái)上架 DeepSeek-R1 和 DeepSeek-V3 模型,推出了超低價(jià)格方案,R1 模型輸入價(jià)格為 2 元每百萬(wàn) token,輸出價(jià)格為 8 元每百萬(wàn) token。
  • 2 月 3 日,阿里云宣布,阿里云 PAI Model Gallery 支持云上一鍵部署 DeepSeek-V3、DeepSeek-R1。
  • 2 月 4 日,京東云宣布,言犀 AI 開發(fā)計(jì)算平臺(tái)已支持 DeepSeek-V3、DeepSeek-R1 以及所有蒸餾小參數(shù)模型(DeepSeek-R1-Distill)的一鍵部署,支持公有云在線部署、?;焖接谢瘜?shí)例部署兩種模式。
  • 2 月 4 日,字節(jié)跳動(dòng)旗下火山引擎宣布支持 ?V3/R1 等不同尺寸的 DeepSeek 開源模型,開發(fā)者可以通過火山引擎機(jī)器學(xué)習(xí)平臺(tái) veMLP 和火山方舟引擎調(diào)用這兩種方式進(jìn)行模型使用。

至此,包括華為、阿里、騰訊、百度、京東、字節(jié)跳動(dòng)等一眾主流的云計(jì)算玩家,紛紛接入到 DeepSeek。

而除了這些大廠之外,包括移動(dòng)云、聯(lián)通云、天翼云在內(nèi)的三大運(yùn)營(yíng)商云也都接入到 DeepSeek——不僅如此,包括金山云、無(wú)問芯穹、青云科技、PPIO 派歐云、云軸科技在內(nèi)的云服務(wù)廠商也都宣布適配及上架 DeepSeek 模型服務(wù)。

需要明確的是,包括華為、阿里、騰訊、百度、京東、字節(jié)跳動(dòng)等國(guó)內(nèi)科技大廠,實(shí)際上早就推出了自家的大模型,各家自成一派,也都在通過大模型的技術(shù)驅(qū)動(dòng)來吸引開發(fā)者和更多云計(jì)算客戶。但如今,它們也都紛紛擁抱 DeepSeek。

為什么?

一位行業(yè)分析人士告訴我們,各大云計(jì)算玩家之所以在自家已經(jīng)推出大模型的前提下紛紛擁抱 DeepSeek,本質(zhì)上還是因?yàn)?DeepSeek 的能力足夠優(yōu)秀,它推出的 DeepSeek-R1 的推理能力已經(jīng)比肩 OpenAI-o1,確實(shí)是比較強(qiáng)大,而且成本足夠便宜——它所采用的開源策略,也意味著更低的部署門檻。

另一方面,DeepSeek 在經(jīng)過龐大的輿論聲量之后,已經(jīng)成為國(guó)內(nèi) AI 技術(shù)的代表之作;在美國(guó)三大科技巨頭已經(jīng)接入的情況下,各大國(guó)內(nèi)云計(jì)算廠商的接入更像是跟進(jìn)行業(yè)熱點(diǎn)、快速做出反饋以及吸引客戶的必要之舉,在這種情況下,「不接入 DeepSeek 反而有點(diǎn)掉隊(duì)了」。

實(shí)際上,DeepSeek 之所以能夠獲得一眾巨頭的擁抱,某種程度上也是由它作為一個(gè)大廠之外的第三方獨(dú)立開發(fā)商的身份決定的。

其中一個(gè)簡(jiǎn)單的邏輯是,如果 DeepSeek-R1 是由阿里推出的,那么百度、騰訊等玩家就可能就不會(huì)選擇接入。

當(dāng)然,由于它所采用的開源策略,DeepSeek 在大火之后,不僅僅在被國(guó)內(nèi)外各大云計(jì)算廠商擁抱,也在被國(guó)內(nèi)的各類算力芯片提供商、計(jì)算設(shè)備提供商、互聯(lián)網(wǎng)服務(wù)商、智能終端廠商所適配和擁抱。

這其中,包括華為、榮耀、OPPO、vivo、魅族在內(nèi)的智能手機(jī)廠商,和包括吉利、極氪、嵐圖、長(zhǎng)城、奇瑞、深藍(lán)、寶駿、智己、猛士等在內(nèi)的智能汽車品牌,也都已經(jīng)官宣接入擁抱 DeepSeek——它們?cè)谙M(fèi)者層面的認(rèn)知度更高,也會(huì)更加提升 DeepSeek 的知名度。

值得一提的是,面向普通用戶,DeepSeek 在官網(wǎng)和 App 都是可以免費(fèi)使用的。

可以說,DeepSeek 的開源之火,已經(jīng)燃遍了中國(guó)科技圈。

AI 的 iPhone 時(shí)刻 & AI 的安卓時(shí)刻自 2012 年 AlexNet 橫空出世以來,人工智能技術(shù)的發(fā)展在十幾年的時(shí)間里,經(jīng)歷了一個(gè)又一個(gè)發(fā)展節(jié)點(diǎn)——它們前后相序,引領(lǐng)著 AI 面向 AGI 進(jìn)行進(jìn)化。其中,在 DeepSeek 一炮而火之前,上一波給整個(gè)世界帶來巨大震撼的是來自于 OpenAI ChatGPT。

2022 年 11 月 30 日,OpenAI 在官網(wǎng)上不動(dòng)聲色發(fā)布了 ChatGPT,沒有任何的線下儀式。然后,在短短幾個(gè)月時(shí)間里,ChatGPT 如同星火燎原一般,徹底火了。

對(duì)于 ChatGPT 的火熱,作為算力芯片受益者的英偉達(dá)給予很高的評(píng)價(jià)和追捧。2023 年 3 月 21 日,在英偉達(dá)一年一度的 GTC 大會(huì)上,針對(duì) OpenAI 旗下 ChatGPT 給整個(gè) AI 行業(yè)帶來的巨大影響,黃仁勛表示:一個(gè)嶄新的計(jì)算平臺(tái)已經(jīng)被發(fā)明出來,而 AI 的 iPhone 時(shí)刻已經(jīng)開始。

就這樣,以這場(chǎng)大會(huì)為節(jié)點(diǎn),「AI 的 iPhone 時(shí)刻」成為一個(gè)行業(yè)熱門詞匯。

而考慮到 iPhone 這個(gè)名詞本身所指代的革命性意義,以及 AI 的長(zhǎng)期發(fā)展對(duì)于一個(gè)關(guān)鍵技術(shù)質(zhì)變點(diǎn)的強(qiáng)烈呼喚,這個(gè)詞匯迅速得到了行業(yè)的廣泛認(rèn)同,而整個(gè)科技行業(yè)對(duì)于 ChatGPT 的關(guān)注和對(duì)它的潛在行業(yè)影響力的重視,也隨著「AI 的 iPhone 時(shí)刻」這個(gè)詞匯到達(dá)前所未有的高度。

到了 2023 年 5 月,馬斯克甚至創(chuàng)造了一個(gè)新詞:「ChatGPT 時(shí)刻」。

當(dāng)時(shí),從整個(gè)行業(yè)來看,以 ChatGPT 的爆發(fā)為引領(lǐng),在全球范圍內(nèi)引發(fā)了一波集體擁抱大語(yǔ)言模型的 AI 技術(shù)浪潮,一波專注于大語(yǔ)言模型的 AI 創(chuàng)業(yè)公司應(yīng)運(yùn)而生,而各大科技廠商紛紛推出自家的大語(yǔ)言模型。

一時(shí)之間,千帆相竟。

然而在千帆相竟之中,扮演領(lǐng)頭角色的,依舊是選擇走閉源路線的 OpenAI。

然而,誰(shuí)能想到,在 OpenAI 發(fā)布 ChatGPT 兩年之后,一家來自大洋彼岸的中國(guó)企業(yè) DeepSeek 能夠在美國(guó) AI 行業(yè)所界定的技術(shù)框架和規(guī)則標(biāo)準(zhǔn)中脫穎而出,以受限的算力和更低的成本,在技術(shù)上與 OpenAI 旗下最先進(jìn)推理模型 OpenAI-o1 一較搞下。

如果這還不夠震撼——還有:在商業(yè)模式上,DeepSeek 采用了占據(jù)技術(shù)理想主義道德制高點(diǎn)的開源模式,不僅僅是論文公開,甚至也包括代碼公開;這不僅僅是讓中國(guó)用戶受益于它,也是以一種完全開放和坦誠(chéng)的態(tài)度去賦能于包括美國(guó)企業(yè)在內(nèi)的全世界用戶。

在這種情況下,即使是開創(chuàng)了「AI 的 iPhone 時(shí)刻」的 ChatGPT,也在當(dāng)?shù)貢r(shí)間 2 月 5 日完全開放給用戶免費(fèi)使用,甚至不需要用戶注冊(cè)。

可以說,ChatGPT 之所以能夠免費(fèi)訪問,DeepSeek 毫無(wú)疑問是厥功甚偉的。

從這個(gè)角度來看,DeepSeek 不僅僅是中國(guó) AI 技術(shù)人員和中國(guó) AI 技術(shù)對(duì)于全球 AI 技術(shù)的重大貢獻(xiàn),也是在商業(yè)層面對(duì)于全球 AI 商業(yè)化發(fā)展的貢獻(xiàn),同時(shí)也是 AI 走向落地、賦能于廣大普通消費(fèi)者的一個(gè)重要推動(dòng)力引擎。

所以,DeepSeek 徹底火了,火遍了全球,更火遍了中國(guó)。

當(dāng)然,拋開 DeepSeek 的政治意義不談,也許我們可以在對(duì) AI 歷史發(fā)展的回望中得出一個(gè)新的啟發(fā):如果說 ChatGPT 的誕生是「AI 的 iPhone 時(shí)刻」,那么,DeepSeek 一炮而紅并成為全球矚目的焦點(diǎn),并且以開源的姿態(tài)賦能于全世界的企業(yè)、開發(fā)者和用戶,從歷史相似性的角度——我們可以說,伴隨著 DeepSeek 的爆發(fā),「AI 的安卓時(shí)刻」已經(jīng)到來。

只不過這一次,「AI 的安卓時(shí)刻」是由一家中國(guó)企業(yè)開啟的。

基于這個(gè)前提,也許我們更加能理解 DeepSeek 創(chuàng)始人梁文峰在采訪中的一句話:我們認(rèn)為,中國(guó)的 AI 不能永遠(yuǎn)做跟隨者。

人們常說,中國(guó) AI 比美國(guó)落后一到兩年,但真正的差距在于「原創(chuàng)」與「模仿」。

如果不改變這一點(diǎn),中國(guó)永遠(yuǎn)只能追趕別人,而不是引領(lǐng)方向。

有些探索是無(wú)法回避的。

本文由人人都是產(chǎn)品經(jīng)理作者【偲睿洞察】,微信公眾號(hào):【智見 Time】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒評(píng)論,等你發(fā)揮!