體驗完文心一言,我的一些思考

0 評論 7112 瀏覽 8 收藏 9 分鐘
🔗 产品经理专业技能指的是:需求分析、数据分析、竞品分析、商业分析、行业分析、产品设计、版本管理、用户调研等。

近期,文心一言的發(fā)布,讓許多人都忍不住想要去一探究竟,并將其與ChatCPT做對比。作者體驗完文心一言后,分析其在各個方面上的使用體驗,總結(jié)了自己一些思考,一起來看看吧。

本文一共分為三個部分,文心一言的使用測評、關(guān)于文心一言的一些思考以及能夠更快的拿到邀請碼的小技巧(彩蛋在最后,不要走開~),我在17號就拿到了文心一言的邀請碼,拿到之后立刻開始了我的體驗,不過在展示測評開始前,還是想寫一些文心一言的邊界:文心一言的回答最多支持5次重新回答。

  • 單次輸入prompt最多為1024個字
  • 在界面停留5分鐘沒有操作后會自動刷新進入新的對話
  • 目前暫不支持視頻和語音

一、文心一言使用評測

百度 CEO 李彥宏在這次發(fā)布會展示了文心一言的五大能力:文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理邏輯推算、中文理解、多模態(tài)生成,我們就根據(jù)它的能力展開測評。

文學(xué)創(chuàng)作:

文學(xué)創(chuàng)作上它能理解我的意思,文章內(nèi)容來看豐富度和故事性還是缺失一些,初中到高中的水平吧。據(jù)稱,文心一言的對語義的數(shù)據(jù)量訓(xùn)練已達(dá)萬億級網(wǎng)頁數(shù)據(jù)和數(shù)十億的搜索數(shù)據(jù)。

商業(yè)文案創(chuàng)作:

商業(yè)文案的創(chuàng)作表現(xiàn)挺優(yōu)秀的,經(jīng)常用于商業(yè)文案創(chuàng)作的博主又多了一個好用的工具,再也不用苦苦想文案了。沒有靈感的時候可以來一言生成內(nèi)容,再結(jié)合自己的特質(zhì)加工,大幅提升了要經(jīng)常寫文案的人效率。

數(shù)學(xué)邏輯推理:

這是一道人大附中的考題,答案是“騎士”,測試了幾道題這里就不都放了??偟膩碚f文心一言的數(shù)據(jù)邏輯推理能力還是偏弱的,不過推理能力本就是AI界的難題。

多模態(tài)測試(僅圖像):

目前文心一言還不支持視頻和語音,在圖片的生成方面我覺得還是不錯的,特別是中國風(fēng)的圖(有邀請碼的強烈推薦體驗一下)。還有就是目前的謠言也很多,目前生成的圖形都是1:1的,有些甚至用長圖去造謠,所以還請各位看官,理性看待,對我們自己的產(chǎn)品還是多加一些信任。

目前網(wǎng)上已經(jīng)傳出了文心一言很多段子了,有些確實很幽默,例如“夫妻肺片”“展示的是一對夫妻的肺,“車水馬龍”展示的則是一輛車在馬路上載著一條龍。對中文的理解并沒有我們期待中的深刻,仍停留在表面意思。當(dāng)然也有傳聞?wù)f是“漢譯英”再傳給Stable Diffusion,這一點我們不得而知。

中文理解:

中文理解來說,總體還算不錯。它能回答你的問題,但是并不是那么的智能。水平的話對標(biāo)的話大概就是GPT3的水平,不過有一些文章還存在未標(biāo)注的情況,看來百度這一次上產(chǎn)品是有點趕了。

二、怎么看待文心一言?

  • 從技術(shù)上看,文心一言和GPT都用了有監(jiān)督精調(diào)、人類反饋強化模型(RLHF)和提示(prompt),并且也是基于Transformer預(yù)訓(xùn)練模型,并且使用自適應(yīng)學(xué)習(xí)率調(diào)整策略,這種模型可以通過大量數(shù)據(jù)進行訓(xùn)練,從而提高模型的泛化能力。
  • 從數(shù)據(jù)上看,文心一言的訓(xùn)練數(shù)據(jù)包括萬億級網(wǎng)頁數(shù)據(jù)、數(shù)十億的搜索數(shù)據(jù)和圖片數(shù)據(jù)、百億級的語音日均調(diào)用數(shù)據(jù),以及5500億事實的知識圖譜等,在語言方面,百度表示文心一言使用了1000億條中英雙語數(shù)據(jù)進行訓(xùn)練。
  • 從產(chǎn)品上看,文心一言目前的水平大概是chat-GPT3的水平,現(xiàn)在對標(biāo)chat-GPT確實有一定的差距。特別是在數(shù)學(xué)推理、語義理解、角色扮演這些方向來說。目前文心一言場景主要是用于智能客服、智能寫作、智能推薦等領(lǐng)域。
  • 從體驗上看,響應(yīng)速度上是很不錯的,對一些文本能力也有認(rèn)知水平,在對語言的理解力和回答的準(zhǔn)確性表現(xiàn)都很好。

總的來說,雖然仍有不足的地方,但是從它的回答上還是能看出百度沉淀下來的技術(shù)能力和創(chuàng)新實力,這也是為什么這篇文章我沒有和chatGPT對比的原因。對比國外的產(chǎn)品我們還有很長的路要走,但是我依然對國內(nèi)AI產(chǎn)品抱有信心。畢竟由于XX原因open AI并沒有對中國開放,在研究語言模型的路上,也只有這些大廠具有研發(fā)“類GPT”的實力,也只有他們研發(fā)出來了,我們在使用這些產(chǎn)品才能更加便捷和普惠。

在在文心一言的發(fā)布會上,李彥宏也承認(rèn),測試文心一言時,還是有很多不完美的地方,但因為市場有需求,大家都希望早一點用上最新最先進的大語言模型,所以在此時就推出。我覺得在這個時候能推出也能自證中國有研發(fā)語言模型的能力和實力,只是發(fā)展速度會慢一些。這兩個月國外的AI產(chǎn)品推出都很驚艷,能這個時候推出已經(jīng)很有勇氣了,我們應(yīng)該給國內(nèi)的產(chǎn)品更多的鼓勵和支持!

三、彩蛋

看到很多人都在排隊等文心一言的邀請碼,這里有個方法或許能幫助你更快的拿到。通過企業(yè)端去申請API接口,百度會發(fā)一個郵件回答你現(xiàn)在企業(yè)版暫時沒開放,再給你發(fā)一個個人版的邀請碼體驗(我也是通過這個方法拿到的,但是現(xiàn)在不知百度有沒有改規(guī)則),下面附上文心一言企業(yè)版申請鏈接:https://cloud.baidu.com/survey_summit/wenxin.html?track=C816552

本文由 @榕意 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自 Unsplash,基于CC0協(xié)議。

該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!