日韩电影免费在线观看中文字,超碰在线免费公开av

搜索

APP

起點課堂會員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會特權(quán)

個人IP打造特權(quán)

30+門專項技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導(dǎo)直播

12場專業(yè)技能直播

會員專屬社群

榮耀標識

開通會員

發(fā)布

注冊 | 登錄

DeepSeek低調(diào)宣稱小更新，結(jié)果用2折價格達到R1水平

知危

2025-03-25

1 評論 1473 瀏覽 1 收藏

🔗 产品经理的职业发展路径主要有四个方向：专业线、管理线、项目线和自主创业。管理线是指转向管理岗位，带一个团队..

DeepSeek 發(fā)布了其 V3-0324 模型，雖然官方將其描述為“小版本迭代”，但實際表現(xiàn)卻遠超預(yù)期。本文將深入探討 DeepSeek-V3-0324 的技術(shù)細節(jié)、性能表現(xiàn)以及其對商業(yè)模型的潛在影響，分析開源模型如何通過低成本和高性能推動行業(yè)變革。

昨晚，DeepSeek 無預(yù)警發(fā)布 DeepSeek-V3-0324 模型，此次更新雖被官方低調(diào)地稱為 “ 小版本迭代 ”，但實測表現(xiàn)遠超預(yù)期。

該模型尤其在代碼生成、前端開發(fā)等方面顯著提升，甚至部分能力比肩 Claude 3.7 Sonnet，引發(fā)全球 AI 社區(qū)熱議。

在大模型競技場測試 KCORES 中，DeepSeek-V3-0324 代碼能力得分 328.3 分，超越普通版 Claude 3.7 Sonnet（ 322.3 分），接近 Claude 3.7 Sonnet 的思維鏈版本（ 334.8分）。

在 Aider LLM Leaderboard 排行榜中，DeepSeek-V3-0324 在多語言基準測試中得分為 55%，比 V3 有顯著提升，比 R1 略低一些。在非思考/推理模型中，它排名第二，僅次于 Claude Sonnet 3.7 。

測試數(shù)據(jù)還表明，在表現(xiàn)良好的模型中，DeepSeek-V3-0324 花費是最低的，比 R1 還低很多，只需大約 1/5，擁有高到令人發(fā)指的性價比。

另外，Claude Sonnet 3.7 Thinking 的花費是 DeepSeek-V3-0324 的 33 倍， o1 是 DeepSeek-V3-0324 的 167 倍。

目前在 DeepSeek 官網(wǎng)，只需要關(guān)閉 “ 深度思考 ” 選項即可使用新模型。

B端产品经理的能力模型与学习提升

B端产品经理面临的第一大挑战，是如何正确的分析诊断业务问题。这也是最难的部分，产品设计知识对这部分工作基本没有帮助，如果想做好业务分析诊断，必须具备扎实 ...

查看详情 >

Hugging Face 上也提供了開源下載，下載地址：https://huggingface.co/deepseek-ai/DeepSeek-V3-0324/tree/main

DeepSeek-V3-0324 包含 685B 參數(shù)，較前代 V3 小幅增加，采用 MoE（專家混合）架構(gòu)，激活參數(shù) 370 億。網(wǎng)友實測 DeepSeek-V3-0324 支持 4-bit 量化，可在 512GB M3 Ultra Mac上以 20+ token/s 速度運行，磁盤占用僅352GB。新模型采用與 DeepSeek-R1 相同的MIT許可，允許自由修改、商用及模型蒸餾，比上一版 V3 更開放。

從測評結(jié)果來看，DeepSeek-V3-0324 前端開發(fā)表現(xiàn)突出，媲美頂級商業(yè)模型。

X 博主 Deepanshu Sharma 僅用簡單提示詞（ “ 用 HTML/CSS/JS 制作現(xiàn)代化登錄頁面 ” ），就能讓新版 V3 一鍵生成 800+ 行代碼，且無錯誤運行，效果媲美 Claude 3.7 Sonnet 。

在經(jīng)典彈跳小球測試中，DeepSeek V3-0324 不僅比 R1 表現(xiàn)更好，博主 Deepanshu Sharma 還認為它生成了最流暢的動作。

在測試中 o3-mini 最初表現(xiàn)看起來不錯，但并沒有正確遵循物理原理，尤其是在視頻中間，球?qū)χ亓]有做出正確的反應(yīng)。

Deepanshu Sharma 評價 DeepSeek V3-0324 “ 表現(xiàn)得像唯一排名第一的非推理模型 ”。

據(jù) X 網(wǎng)友 karminski-牙醫(yī)介紹，在升級版的 20 小球物理模擬測試中，DeepSeek V3-0324 相比 V3 也表現(xiàn)更優(yōu)。

而新版 V3 與頭部推理模型的比較情況如下：

在火星任務(wù)測試中，DeepSeek-V3-0324 提升巨大，星球、圖例渲染正確，發(fā)射和返回的窗口計算也有很大進步。

結(jié)合 UI 設(shè)計和物理模擬，X 網(wǎng)友 Parul Pandey 還用 DeepSeek-V3-0324 生成了一個可交互物理模擬界面，通過 AnyChat 使用 DeepSeek-V3-0324 模擬水分子。

實際運行中，可以通過溫度滑塊提升溫度，讓分子呈現(xiàn)越來越快的前進和碰撞反彈運動。

提示詞：創(chuàng)建一個交互式模擬，顯示水分子形成和斷裂氫鍵的過程，同時顯示溫度滑塊。

對于本次升級的技術(shù)難度，有 Reddit 網(wǎng)友 pigeon57434 給出了比較中立的解讀：不用太驚嘆本次 V3 升級的幅度，因為 RL （強化學(xué)習(xí)，Reinforcement Learning ）潛力極大。以 QwQ-32B 為例，盡管它實際上小了 20 倍，但它在某些方面的表現(xiàn)幾乎與 R1 一樣好，甚至比 R1 更好。它能那么強，只是因為擴展推理模型還有很大空間，甚至不需要新的基礎(chǔ)模型。我敢打賭，使用更復(fù)雜的技術(shù)，可以輕松獲得基于 DeepSeek-V2.5 的推理模型來擊敗 R1，更不用說這個新版本的 V3 了。

總的來說，這樣的免費+高性能的組合將對 OpenAI、Anthropic 等閉源商業(yè)模型形成越來越大的壓力。

DeepSeek 此次更新再次證明開源模型的爆發(fā)力，不僅技術(shù)指標逼近頂級商業(yè)AI，更以低成本、高自由度推動行業(yè)變革。

可以合理推測，此次更新有可能是R2的前置版本，類似去年 V3 ( 24.12.16 )→R1 ( 25.01.20 ) 的發(fā)布節(jié)奏，或許幾周內(nèi)我們可能迎來更強的推理模型 R2。

隨著 R2 的臨近，全球 AI 競爭格局或?qū)⒂瓉硇乱惠喯磁啤?/strong>

參考資料：

https://github.com/KCORES/kcores-llm-arena

https://x.com/paulgauthier/status/1904304052500148423

https://x.com/deepanshusharmx/status/1904224760399282587

https://x.com/deepanshusharmx/status/1904363892899492141

https://x.com/karminski3/status/1904212084306653648

https://x.com/pandeyparul/status/1904352867433242926

https://www.reddit.com/r/LocalLLaMA/comments/1jip611/deepseek_releases_new_v3_checkpoint_v30324/

https://aider.chat/docs/leaderboards/

https://x.com/awnihannun/status/1904177084609827054

撰文：流大古編輯：大餅

本文由人人都是產(chǎn)品經(jīng)理作者【知?！浚⑿殴娞枺骸局！?，原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理，未經(jīng)許可，禁止轉(zhuǎn)載。

題圖來自Unsplash，基于 CC0 協(xié)議。

更多精彩內(nèi)容，請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App

AI應(yīng)用 DeepSeek 產(chǎn)品分析行業(yè)觀察

知危

提供敏銳、獨到的商業(yè)信息與參考，重點關(guān)注TMT、出海、新消費等

58篇作品 150139總閱讀量

為你推薦

加上大模型后，SaaS未來走向會更新嗎？

06-011987 瀏覽

東方甄選的知識帶貨遇上瓶頸，最終還是回歸到了“講產(chǎn)品”

03-244441 瀏覽

成功B端产品经理的年终总结秘诀：掌握这几个技巧！
刚刚

大廠秋招又起：為什么“ATMD”成第一梯隊

08-166459 瀏覽

從用戶視角，評價海馬體的產(chǎn)品與服務(wù)

11-292558 瀏覽

App Store 中的節(jié)日營銷策略

08-232085 瀏覽

評論

評論請登錄

汪仔4598

看完文章，直觀感覺到：DeepSeek-V3-0324模型以顯著提升的性能和極高的性價比，展現(xiàn)了開源AI模型的強大潛力，對閉源商業(yè)模型構(gòu)成了有力競爭，推動了AI行業(yè)的快速發(fā)展與變革。

最近來自山東回復(fù)

举报

為你推薦

小公司成长记：如何自我提升业务理解能力？

網(wǎng)易云、QQ音樂、酷狗、汽水……你的音樂軟件懂你嗎？

06-146570 瀏覽

產(chǎn)品經(jīng)理競爭力有哪些？

08-221045 瀏覽

成為超級個體，輕資產(chǎn)盈利模式

10-272356 瀏覽

推荐专题更多专题

专题
19948人已学习14篇文章

如何搭建用户成长体系？

好的用户成长体系可以促进用户活跃、增强用户粘性、留住用户和帮助企业更好地了解用户对产品的使用情况。本专题的文章提供了搭建用户成长体系的思路。
专题
14316人已学习13篇文章

运营方法论

作为一名运营，需要持续对自己的经验进行总结并不断更新迭代。本专题的文章分享了运营方法论。
专题
15508人已学习12篇文章

交互设计文档的撰写指南

本专题的文章分享了交互设计文档的撰写指南。
专题
12674人已学习13篇文章

产品的销售策略

产品经理在日常工作中，除了要跟进和把控产品的整体流程以外，也要对产品后续的销售策略进行规划；销售策略的规划可以让产品经理对于用户的场景以及体验等更加熟悉。本专题的文章分享了产品的销售策略。
专题
15065人已学习11篇文章

如何做SWOT分析？

SWOT分析法是互联网人最常用的分析模型之一，将企业内外部条件各方面内容进行综合和概括，进而分析组织的优劣势，面临的机会和威胁的一种方法。本专题的文章分享了如何做SWOT分析。
专题
15361人已学习10篇文章

APP广告投放指南

再好的产品，没有优质的推广渠道加持和App投放增长的方法，也很难实现有效传播和增长。本专题的文章分享了App投放推广指南。

社群
付费群 | 免费群

产品经理交流群加入
AI 学习交流群加入
华为鸿蒙交流群加入
运营增长交流群加入
小红书抖音视频号群加入
30岁+中年转型交流加入

快訊
查看更多

熱門文章

跨境支付六大趨勢：實時支付、穩(wěn)定幣、AI、全球互聯(lián)等如何重塑萬億市場（簡版）

03-18

【AI產(chǎn)品經(jīng)理進階】萬字深析文心x & 文心4.5

03-17

如何破解这三个产品面试高频问题？一套完整的破题思路在此！

刚刚

數(shù)智化時代傳統(tǒng)零售生死局：胖東來、永輝的「突圍戰(zhàn)」給行業(yè)上了怎樣一課？

03-05

從認知到忠誠：B2B內(nèi)容營銷的5A階段應(yīng)該干什么？

03-19

私域人貨場體系搭建SOP：14張圖說透私域人貨場體系搭建和底層邏輯

03-28

教培機構(gòu)老師做招生，只要你足夠懶就好了

03-07

關(guān)于
人人都是產(chǎn)品經(jīng)理（woshipm.com）是以產(chǎn)品經(jīng)理、運營為核心的學(xué)習(xí)、交流、分享平臺，集媒體、培訓(xùn)、社群為一體，全方位服務(wù)產(chǎn)品人和運營人，成立12年舉辦在線講座1000+期，線下分享會500+場，產(chǎn)品經(jīng)理大會、運營大會50+場，覆蓋北上廣深杭成都等20個城市，在行業(yè)有較高的影響力和知名度。平臺聚集了眾多BAT美團京東滴滴360小米網(wǎng)易等知名互聯(lián)網(wǎng)公司產(chǎn)品總監(jiān)和運營總監(jiān)，他們在這里與你一起成長。

合作伙伴

鏈接

隱私政策

投稿須知

意見反饋

幫助中心

公眾號

視頻號

友情鏈接

PM265

產(chǎn)品經(jīng)理導(dǎo)航

起點課堂

豬八戒網(wǎng)

人才熱線

伙伴云表格

網(wǎng)易易盾

個推

友盟+

糧倉

創(chuàng)業(yè)邦

每日報告

鳥哥筆記

慕課網(wǎng)

旗下品牌: 起點課堂 | 運營派 | 糧倉企微管家
?2010-2024 - 人人都是產(chǎn)品經(jīng)理 - 粵ICP備14037330號-粵公網(wǎng)安備 44030502001309號
 廣播電視節(jié)目制作經(jīng)營許可證（粵）字第03109號增值電信業(yè)務(wù)經(jīng)營許可證粵B2-20190788 版權(quán)所有 ? 深圳聚力創(chuàng)想信息科技有限公司