一级做A爰片久久毛片人呢,精品无人区一区二区三区

APP

起點課堂會員權益

職業(yè)體系課特權

線下行業(yè)大會特權

個人IP打造特權

30+門專項技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導直播

12場專業(yè)技能直播

會員專屬社群

榮耀標識

發(fā)布

注冊 | 登錄

阿里版ChatGPT突然上線邀測！大模型熱戰(zhàn)正劇開始，這是第一手體驗實錄

2023-04-07

2 評論 10094 瀏覽 41 收藏

🔗 B端产品经理需要更多地关注客户的商业需求、痛点、预算、决策流程等，而C端产品经理需要更多地关注用户的个人需求

ChatGPT掀起的戰(zhàn)局，現(xiàn)在又多了一位選手了！阿里版ChatGPT現(xiàn)在已經官宣對外開放企業(yè)邀測，名為“通義千問”，由達摩院開發(fā)。那么，阿里版ChatGPT“通義千問”在能力上表現(xiàn)如何？不妨來看看作者的評測與分析。

阿里正式加入ChatGPT戰(zhàn)局！

就在剛剛，阿里版類ChatGPT突然官宣正式對外開放企業(yè)邀測。

它叫通義千問，由達摩院開發(fā)。

嗯，是大模型版十萬個為什么那個味兒了。

事實上，早在這個月初，就傳出過不少阿里要推出類ChatGPT的消息，不過普遍預期在11號左右。

而前幾天率先流出的天貓精靈“鳥鳥分鳥”脫口秀版GPT，就是基于大模型的“壓縮版”，已經以其驚艷表現(xiàn)把網(wǎng)友的胃口吊了起來，讓眾人將目光投向阿里。

如今“正菜”提前上桌，自然一點即著，引爆輿論關注。

所以，這個阿里版ChatGPT“通義千問”，究竟實力幾何？

恰好量子位拿到了第一批邀測資格，省流結論：中文大模型真正的競爭開始了。

咱們實測見真章。

一、調戲阿里版ChatGPT實錄

先來看看通義千問的主要功能。

作為一個大語言模型，它的能力主要集中在文本生成上，即也能像ChatGPT一樣“問啥答啥”：

阿里版ChatGPT突然上線邀測！大模型熱戰(zhàn)正劇開始，這是第一手體驗實錄

這里我們試一下官方給的撰寫短文，看起來連語文老師常用的“總分總”也能理解：

阿里版ChatGPT突然上線邀測！大模型熱戰(zhàn)正劇開始，這是第一手體驗實錄

△又一個中文寫作業(yè)神器（doge）

除了對話外，它還具備一個“百寶袋”功能，里面相當于一個工具箱，能快速生成各種指定類型的文案：

阿里版ChatGPT突然上線邀測！大模型熱戰(zhàn)正劇開始，這是第一手體驗實錄

話不多說，先從語言能力、上下文理解能力、代碼能力和數(shù)學能力四個方向，來測測模型的對話能力。

1. 對話能力

1）語言能力

要說國內大模型，首先要看的還得是中文。

先來個最基礎的：“能穿多少穿多少”是什么意思？

不錯，解釋得比較清楚，還順便聊了一下自己對這句話的看法：

阿里版ChatGPT突然上線邀測！大模型熱戰(zhàn)正劇開始，這是第一手體驗實錄

續(xù)寫類的創(chuàng)意寫作，不但能模仿語氣，甚至還能創(chuàng)造懸疑，有點厲害喲~

阿里版ChatGPT突然上線邀測！大模型熱戰(zhàn)正劇開始，這是第一手體驗實錄

接下來就輪到新一代AI benchmark弱智吧問題了：怎么才能把夢里的錢取到銀行卡里？

“在夢里取錢是一種幻覺或想象”，謝謝你清醒俠。

還有更扎心的……“如果您經常做夢夢到錢，建議您睡前回顧一下自己的財務狀況，看看有什么不足之處”

阿里版ChatGPT突然上線邀測！大模型熱戰(zhàn)正劇開始，這是第一手體驗實錄

雖然阿里的朋友稱，通義千問主要是中文不錯，但我們叛逆一點，看看這個中文大語言模型的其他語言水平怎么樣。

先不走尋常路，試試通義千問的日語能力，給花澤香菜寫一封情書。

看中文機翻似乎還不錯，這就把它寄給香菜，應該沒問題吧？

阿里版ChatGPT突然上線邀測！大模型熱戰(zhàn)正劇開始，這是第一手體驗實錄

再來試試英語。剛好前段時間有網(wǎng)友PK了一下Bard和GPT-4的Rap，我們也來看看通義千問的說唱能力。

這top，這stop，還給押上了！就是不知道姆爺認不認可。

阿里版ChatGPT突然上線邀測！大模型熱戰(zhàn)正劇開始，這是第一手體驗實錄

試試加點難度，中英夾雜的諧音梗？

這個時候，通義千問的回答就顯得有點嚴肅了。

阿里版ChatGPT突然上線邀測！大模型熱戰(zhàn)正劇開始，這是第一手體驗實錄

當我們給出答案的時候，雖然通義千問看出了這是個笑話，但它并不覺得好笑，還很嚴肅地指正我們：這并不意味著松下懼怕索尼。

阿里版ChatGPT突然上線邀測！大模型熱戰(zhàn)正劇開始，這是第一手體驗實錄

不過我們發(fā)現(xiàn)，ChatGPT同樣一本正經……這年頭的AI都這么正義么……

阿里版ChatGPT突然上線邀測！大模型熱戰(zhàn)正劇開始，這是第一手體驗實錄

好，下一個試試它的上下文理解能力。

2）上下文理解能力

這部分說白了就是多輪對話能力，考查通義千問能不能準確提取上文的信息，用于下輪問題的回答。

來聽題：山東一縣一酒是真的嗎？

阿里版ChatGPT突然上線邀測！大模型熱戰(zhàn)正劇開始，這是第一手體驗實錄

模糊掉山東試試？讓它列舉“這個省”幾個經典的白酒牌子：

阿里版ChatGPT突然上線邀測！大模型熱戰(zhàn)正劇開始，這是第一手體驗實錄

不錯。再試著從最新的回答中追問一下：

阿里版ChatGPT突然上線邀測！大模型熱戰(zhàn)正劇開始，這是第一手體驗實錄

等等，“據(jù)史書記載”不會是編的資料吧？追問×2：

阿里版ChatGPT突然上線邀測！大模型熱戰(zhàn)正劇開始，這是第一手體驗實錄

有意思的是，我們確實在孔府家酒的官網(wǎng)找到了資料來源：

阿里版ChatGPT突然上線邀測！大模型熱戰(zhàn)正劇開始，這是第一手體驗實錄

3）代碼能力

接著，來試試它的代碼能力。整個計算器程序試試？

阿里版ChatGPT突然上線邀測！大模型熱戰(zhàn)正劇開始，這是第一手體驗實錄

還不錯，實現(xiàn)了簡單的四則運算。

那么，讓將它這段代碼改寫成Python：

阿里版ChatGPT突然上線邀測！大模型熱戰(zhàn)正劇開始，這是第一手體驗實錄

再讓它解釋一下自己寫過的每一段代碼：

阿里版ChatGPT突然上線邀測！大模型熱戰(zhàn)正劇開始，這是第一手體驗實錄

基礎編程能力，似乎問題不大？

不過，如果要讓通義千問將解釋改寫成注釋，就會出現(xiàn)一點神奇的bug。

雖然它給“Python”代碼標好了注釋，但等等，這不是最初的C++版代碼嘛！

阿里版ChatGPT突然上線邀測！大模型熱戰(zhàn)正劇開始，這是第一手體驗實錄

（這何嘗不是一種NTR）

3）數(shù)學能力

最后來看看數(shù)學問題。雞兔同籠，還不錯：

阿里版ChatGPT突然上線邀測！大模型熱戰(zhàn)正劇開始，這是第一手體驗實錄

普通的計算題也沒什么問題，還能精確到小數(shù)點后幾位：

阿里版ChatGPT突然上線邀測！大模型熱戰(zhàn)正劇開始，這是第一手體驗實錄

巴特，高數(shù)題就不太行了，雖然它發(fā)現(xiàn)了這道題需要求導，但求解方法卻出了錯……

阿里版ChatGPT突然上線邀測！大模型熱戰(zhàn)正劇開始，這是第一手體驗實錄

不過通義千問也明確表示，無法保證在所有情況下給出正確的答案：

阿里版ChatGPT突然上線邀測！大模型熱戰(zhàn)正劇開始，這是第一手體驗實錄

嗯…和GPT們一樣，大模型的數(shù)學能力都比較初級。

對話能力測得差不多，接下來再看看它的“場景能力”。

2. 場景能力

雖然通義千問“百寶袋”給出了不少功能，不過寫提綱、描述商品這些都很常見了，我們就挑了三個比較有意思的來試試：菜譜生成、彩虹屁生成器和免費代寫情書。

1）會放飛的菜譜

眾所周知，寫菜譜是個技術活兒，既考驗上下文能力（說過的材料都得用到），還得考考AI的理解菜名能力，做菜的步驟還不能太離譜。

示例的“清蒸鱸魚”，對AI來說顯然太簡單了。這不得整點游戲里奇怪的菜名給它試試？

先來一份《原神》里的飽腹感凝膠。

阿里版ChatGPT突然上線邀測！大模型熱戰(zhàn)正劇開始，這是第一手體驗實錄

好家伙，竟然想到用現(xiàn)實中的魔芋粉來模仿飽腹感凝膠，這創(chuàng)意不錯。（不過卡路里粉是什么鬼，蛋白粉嗎？）

阿里版ChatGPT突然上線邀測！大模型熱戰(zhàn)正劇開始，這是第一手體驗實錄

那么，同樣的菜再試試讓ChatGPT做一遍，你感覺哪個更好吃？

阿里版ChatGPT突然上線邀測！大模型熱戰(zhàn)正劇開始，這是第一手體驗實錄

再給通義千問來道加試題，讓它試試《星露谷物語》里面，用虛空蛋做的奇怪的小面包？

等等，真把虛空蛋放進食譜了？而且還真的做了份面包出來！就是不知道口感如何……

阿里版ChatGPT突然上線邀測！大模型熱戰(zhàn)正劇開始，這是第一手體驗實錄

照這樣看，游戲中的食譜都能給通義千問還原一遍了，直接打破次元壁。

2）彩虹屁生成器

接下來，再試試讓它生成一份彩虹屁。

阿里版ChatGPT突然上線邀測！大模型熱戰(zhàn)正劇開始，這是第一手體驗實錄

硬生生把衣服上的油漬夸成了藝術品……

阿里版ChatGPT突然上線邀測！大模型熱戰(zhàn)正劇開始，這是第一手體驗實錄

嗯，各大夸夸群可以考慮引入一個了。

3）免費代寫情書

最后，我們的測試以給野獸先輩寫一份情書做結尾。

阿里版ChatGPT突然上線邀測！大模型熱戰(zhàn)正劇開始，這是第一手體驗實錄

你感覺怎么樣？

好了，看了這么多五（奇）花（奇）八（怪）門（怪）的測評，你是不是也有點好奇通義千問是怎么來的了？

二、通義千問從何而來？

關于通義千問的技術細節(jié)，阿里達摩院官方沒有透露詳細信息。

而通義千問自己，是這么回答的：

訓練資料來自阿里巴巴達摩院，截止到2023年2月。訓練資料包括大量語言和文本數(shù)據(jù)，包括中英日法西班牙語多語種文本數(shù)據(jù)。

還提到自己是個能聯(lián)網(wǎng)的大語言模型。

阿里版ChatGPT突然上線邀測！大模型熱戰(zhàn)正劇開始，這是第一手體驗實錄

不過，我們實測了一下，發(fā)現(xiàn)千問只是虛晃一槍，假裝自己會上網(wǎng)（doge）。

實際上，當你單獨問它今天天氣如何時，通義千問會承認它不能訪問實時數(shù)據(jù)。

但如果你拋給它一個查詢天氣的網(wǎng)站，它就會假裝自己看到了網(wǎng)頁內容，然后一本正經地胡謅一番。

阿里版ChatGPT突然上線邀測！大模型熱戰(zhàn)正劇開始，這是第一手體驗實錄

此處應喊話阿里程序員：你家大模型是真的想上網(wǎng)了。

書歸正傳，盡管官方口徑低調，但正如ChatGPT脫胎于OpenAI的GPT系列，百度文心一言是自Ernie大模型發(fā)展而來，阿里也是國內最早開始研發(fā)大模型的技術大廠之一。

公開資料顯示，2019年，阿里就已經啟動了中文大模型研發(fā)。當時阿里發(fā)布的語言大模型StructBERT超越谷歌、微軟、Facebook，登頂了CLUE榜單。

2021年，阿里先后發(fā)布了國內首個超百億參數(shù)多模態(tài)大模型M6，以及被稱為“中文版GPT-3”的語言大模型PLUG。

其中，M6在多次迭代之后，實現(xiàn)了十萬億級別的參數(shù)規(guī)模，并且M6和支付寶、淘寶的業(yè)務需求相結合，首個在國內實現(xiàn)了商業(yè)化落地。

PLUG的參數(shù)規(guī)模則為270億，是基于達摩院的兩種自研模型——語言理解模型StructBERT和語言生成模型PALM打造。

這一大模型初登場，就以80.614分刷新了權威中文語言理解基準CLUE分類任務榜單記錄。

阿里版ChatGPT突然上線邀測！大模型熱戰(zhàn)正劇開始，這是第一手體驗實錄

在去年的WAIC（世界人工智能大會）上，阿里還發(fā)布了通義大模型系列。其中核心模型均已開源開放。

阿里版ChatGPT突然上線邀測！大模型熱戰(zhàn)正劇開始，這是第一手體驗實錄

三、大模型時代，中國力量加速競逐

那么，你會給這個阿里版ChatGPT打幾分？

需要承認的是，相比于現(xiàn)在的業(yè)界標桿ChatGPT（GPT-4），通義千問還有不少進步空間。阿里方面也透露，根據(jù)內測反饋，這一大模型正在飛速迭代中。

此前，微軟被曝曾專門為ChatGPT砸下數(shù)億美元，打造由上萬張英偉達A100組成的專用超算。而綜合各方消息來看，目前國內擁有這一數(shù)量級高性能顯卡的企業(yè)屈指可數(shù)，阿里是其中之一。

大模型時代，已經形成行業(yè)共識的一點是，打造大模型，AI和云計算缺一不可。

而阿里，是全球少數(shù)在算法和算力上都有領先布局的公司之一。

除了本身在人工智能和大模型方面長期的技術積累，背靠國內第一、亞洲第三的云廠商，阿里在算力方面也具備天然的優(yōu)勢。

ChatGPT這把火燒到如今，國內對具備足夠競爭力的國產生成式大模型的需求，正在與日俱增。

ChatGPT類產品提升生產效率的潛力，已經被不斷驗證。但與此同時，前有ChatGPT大規(guī)模封號、亞洲成重災區(qū)，后有OpenAI因算力問題停售ChatGPT Plus……

種種不確定因素，再一次凸顯了技術自研的價值。

所幸這次，我們的起跑線，并沒有相差那么遠。

游戲不會在一夜間結束，而現(xiàn)在，競逐真正開始。

作者：蕭簫，魚羊

來源公眾號：量子位（ID：QbitAI），追蹤人工智能新趨勢，關注科技行業(yè)新突破

本文由人人都是產品經理合作媒體 @量子位授權發(fā)布于人人都是產品經理，未經許可，禁止轉載。

題圖為通義千問官網(wǎng)截圖

該文觀點僅代表作者本人，人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容，請關注人人都是產品經理微信公眾號或下載App

追蹤人工智能新趨勢，關注科技行業(yè)新突破

74篇作品 197022總閱讀量

打造優(yōu)秀的“人類伙伴”：聊聊用戶體驗智能感三要素

08-214241 瀏覽

打造優(yōu)秀的“人類伙伴”：聊聊用戶體驗智能感三要素

流程也是一款產品

09-072375 瀏覽

流程也是一款產品

C端转B端：我的产品经理角色调整之路

刚刚

月入3萬的流量主項目，到底靠譜不靠譜？

10-123674 瀏覽

月入3萬的流量主項目，到底靠譜不靠譜？

產品周報235期 | 數(shù)字人民幣無網(wǎng)無電支付功能正式上線，支付寶 2023 年“集五?！被顒?月10日 0 點開啟

01-134211 瀏覽

產品周報235期 | 數(shù)字人民幣無網(wǎng)無電支付功能正式上線，支付寶 2023 年“集五?！被顒?月10日 0 點開啟

談談 B 端產品如何讓員工“用得順、用得爽”

03-203427 瀏覽

談談 B 端產品如何讓員工“用得順、用得爽”

評論

李曉劍

這個飽腹感凝膠在原神里怎么沒聽過??

最近來自四川回復
YANJU

求邀請碼

最近來自中國回復

转岗产品经理的求职难题，你遇到过吗？

145587人已学习15篇文章

产品经理必懂的技术知识

作为产品经理，你多多少少得懂点技术。

13054人已学习13篇文章

数据分析方法论

本专题的文章分享了产品经理数据分析方法论。

30289人已学习15篇文章

区块链浪潮来袭，产品经理和运营人该如何应对？

如果能落地，区块链并不是空气。

14242人已学习14篇文章

如何提升付费转化率？

流量难获取，获取之后转化为付费用户更是困难。本专题的文章分享了如何提升付费转化率。

15235人已学习13篇文章

数据分析报告写作指南

本专题的文章分享了数据分析报告写作指南。

17929人已学习13篇文章

如何搭建用户等级体系？

用户等级体系是产品的底层基础之一，也是用户成长激励体系之一。本专题的文章分享了如何搭建用户等级体系。

<center id="ryg2n"><optgroup id="ryg2n"></optgroup></center>