騰訊終究還是出了大模型,測了下感覺還行
就在昨天,騰訊也發(fā)布了自己的通用大模型——騰訊混元大模型,具體其表現(xiàn)如何?作者對其進(jìn)行了體驗,并總結(jié)了相關(guān)體驗感受,與你分享。
今天,騰訊官宣亮相了混元大模型。
6 月中旬,騰訊曾推出了自己面向 B 端行業(yè)的 MaaS( Model-as-a-service,模型即服務(wù) )解決方案,方案中包含了很多行業(yè)大模型,但沒有通用大模型。
現(xiàn)在,騰訊終究還是忍不住了。
這次,知危編輯部也想辦法獲得了混元大模型的體驗資格,下面就帶大家看看混元的能力。
首先是常規(guī)的對話,我們先看看多輪對話:
以上內(nèi)容僅能展示連續(xù)對話,內(nèi)容真實性無法驗證。
正常的問題是可以一直聊下去的( 與其他同行相同,混元也有最大連續(xù)對話數(shù)的限制 ),回答的內(nèi)容也尚可,并且它會知道哪些信息可以說、哪些信息不可以說。
下面我們看看它提供方案的能力:
策略上沒有什么太大的問題,考慮得相對周到,還是有一定參考價值的。
再讓它生成一個演講稿:
覺得有些太正式官方了,讓他調(diào)整了一下:
混元的表現(xiàn)尚可,還是可以起到啟發(fā)或者生產(chǎn)力工具的作用的。
下面我們再看看它的語義理解能力:
當(dāng)我們要求進(jìn)一步解釋時,混元應(yīng)對的也比較好:
除了常規(guī)的對話,混元還給出了比較豐富的 “ 特調(diào) ” 應(yīng)用,叫作 “ 靈感發(fā)現(xiàn) ”,囊括了各個場景下的諸多功能:
我們測試了一下社群營銷文案,剛好最近中秋節(jié)要到了,看到一些社群在發(fā)月餅團(tuán)購文案,就讓混元也試了一下。
作為對比,我們先找了一下盒馬社群關(guān)于月餅的社群營銷文案看看大概什么樣:
混元的表現(xiàn)如下:
感覺味兒還是對的,隨便修修改改就能用。
除此之外,還有專門的代碼模式和代碼解釋器。
我們先讓混元生成了一段 2048 游戲的代碼:
然后再把它生成的代碼扔進(jìn)它的代碼解釋器功能里,它解釋的還行:
好了,編輯部的測試大概就是這么多,總地感覺下來,混元的水平跟國內(nèi)一線大廠持平,說不上驚艷,但也沒掉隊,執(zhí)行各種不同領(lǐng)域任務(wù)時的表現(xiàn)在 GPT-3.5 水平上下浮動。
自打 8 月 15 日《 生成式人工智能服務(wù)管理暫行辦法 》開始施行后,行業(yè)開始有了明晰的規(guī)范,已經(jīng)有一批大廠的大模型獲得了全量面向公眾開放的資格。
這意味著行業(yè)迎來了一個成熟的時機(jī):數(shù)量不設(shè)限的用戶可以更好地給大模型提供訓(xùn)練資料,讓大模型更快成長。
所以,騰訊大模型的發(fā)布,極有可能是看中了這一點。
如此一來,最后一個一線大廠也加入了通用大模型的 “ 大亂斗 ” 中。
希望未來某一天,它們能卷出點讓人眼前一亮的東西。
作者:二筒;編輯:大餅
來源公眾號:知危(ID:BusinessAlert),提供敏銳、獨(dú)到的商業(yè)信息與參考,重點關(guān)注TMT、出海、新消費(fèi)、新能源。
本文由人人都是產(chǎn)品經(jīng)理合作媒體 @知危 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自騰訊混元大模型官網(wǎng)
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
哈哈,8月20-22怎么會是周末