實力強的大模型都有哪些超能力?

0 評論 1017 瀏覽 1 收藏 7 分鐘
🔗 产品经理的职业发展路径主要有四个方向:专业线、管理线、项目线和自主创业。管理线是指转向管理岗位,带一个团队..

現(xiàn)階段,許多類型的大模型涌現(xiàn)在市面上,那么,這些大模型可以分成哪些類型?實力強的大模型,又都具備哪些能力呢?這篇文章里,作者分享了他的看法,一起來看。

前幾日,人工智能研究公司OpenAI CEO山姆·奧特曼(Sam Altman)在談及人工智能這項技術的潛力以及人們對它的擔憂時,曾表示“AI發(fā)展速度快得嚇人,就像停不下來的龍卷風?!笨梢?,人工智能正在以它超前的速度改變世界。

在經(jīng)歷了年初人工智能之大模型風口的狂熱之后,截止2023年10月,我國擁有10億參數(shù)規(guī)模以上大模型的廠商及高校院所達到了254家,這其中既有通用大模型(AGI),也有垂直大模型。換句話說,就是每隔幾天,國內就會官宣一個新的大模型。

但越來越多的從業(yè)者會發(fā)現(xiàn),大模型的智能化與商業(yè)化落地其實并沒有那么快速。

隨著大模型技術的演變和業(yè)務的落地推進,會像大浪淘沙般將一些參與主體過濾出去,最終,只有手握硬核技術實力和資源的企業(yè)才能活下去。

那么,現(xiàn)階段國內如此多的大模型,都有哪些類型?哪家實力最強呢?

一、通用大模型與垂直大模型,哪個有前景

據(jù)稱,國內大模型已近80個,這其中包括通用大模型和垂直大模型(也叫專用大模型)。它們二者相比,孰高孰低呢?其實二者如果從應用角度出發(fā)考慮的話,都具有各自的特點。

通用大模型(AGI)是指適用于多個領域或行業(yè)的大模型,例如自然語言處理領域的預訓練模型、圖像識別領域的預訓練模型等等。

這種大模型具有更廣泛的的應用范圍,可以在多個領域內發(fā)揮作用。我們常常聽到的人工智能公司OpenAI開發(fā)的ChatGPT、阿里的通義千問、百度的文心一言等都是通用大模型的代表。

而垂直大模型則是針對某個特定的領域或行業(yè)研發(fā)的大模型,例如醫(yī)療領域的大模型、金融領域的大模型、物流領域的大模型等。

就比如物流場景涉及單證(物流活動中進行物流承運而出具的合法效力文件,比如物流承運合同單證等)多、格式不統(tǒng)一等問題,物流大模型可以對其進行快速、準確的標準化識別,提供結構化數(shù)據(jù)并做好糾錯、補全等操作,保障后續(xù)運單分單、履約配送等環(huán)節(jié)的質量和效率。

這種大模型在特定領域內具有更高的專業(yè)性和針對性,能夠更好地解決該領域內的特定問題,因此垂直大模型也叫專用大模型。

可以說每個跟每個之間非常難以比較,所以也很難說哪個最有前途。

二、實力強的大模型擁有哪些超能力

雖然無法使用一個定律來比較出通用大模型與垂直大模型的優(yōu)劣,但實力強的大模型擁有的“超能力”總是具有共性的,也具有更廣闊的發(fā)展?jié)摿Α?/p>

1. 超大算力

相較于一般AI應用,大模型應用的訓練及推理需要更強的算力支持,可以說算力決定了一個通用大模型的底線。

國內提供云服務的阿里云、騰訊云自身就擁有超大算力,這是他們研發(fā)的大模型所具有的最大競爭力。

2. 數(shù)據(jù)量大

訓練大模型需要更大的數(shù)據(jù)量,更好的數(shù)據(jù)質量,更多樣性的數(shù)據(jù)源。因此在大家算力都夠、大模型架構差不多的情況下,誰若再加上數(shù)據(jù)量多、數(shù)據(jù)質量高的優(yōu)勢,便會相應地提升大模型的質量,大模型落地應用的效果也就會越好。

3. 是開源大模型

還有一個考慮的因素是是否是開源大模型。開源由于源代碼公開,可以根據(jù)用戶的需求隨時修改和定制開發(fā),且一般是免費的(免費使用降低了大模型的使用門檻,例如國外的ChatGPT和國內的文心一言的爆火恰就是因為它使用便捷,人人只需注冊即可體驗),可以讓更多的開發(fā)人員和用戶參與,提高大模型的質量和穩(wěn)定性開源的大模型代表有阿里的通義千問。

閉源大模型則由開發(fā)公司維護,雖然可以控制大模型的質量和穩(wěn)定性,但如果不能不斷地提升自己的模型能力,不能保持長期不可動搖的領先性能,有可能會被開源取代。所以屬于閉源的大模型ChatGPT、文心一言等需要保持強勁的性能。

4. 是否擁有API接口

開放服務能力是評價大模型能力的重要要素之一,大模型開放了API接口可以幫助其提升開放性,改善對外服務能力。

API接口開放對于專業(yè)人員來說必不可少??蒲腥藛T可以利用其做大量的測試。個人創(chuàng)業(yè)者也可以利用接口將其運用到實際的業(yè)務中。

相信在不久的將來,隨著大模型面臨的技術和成本問題被解決,相關的企業(yè)級應用或消費型應用落地的節(jié)奏將會加快。這樣也會凸顯出一批批強大的大模型廠商和應用型產(chǎn)品,而這些廠商和產(chǎn)品很大可能出自于今天這些已嶄露頭角的大模型產(chǎn)品。

作者:馬曉東;公眾號:馬曉東國云數(shù)據(jù)CEO

本文由 @國云數(shù)據(jù)馬曉東 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉載。

題圖來自Unsplash,基于CC0協(xié)議。

該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!
专题
16106人已学习13篇文章
在互联网时代,把网站的服务封装成一系列计算机易识别的数据接口开放出去,供第三方开发者使用,这种行为就叫做Open API。 而提供开放API的平台本身就被称为开放平台。本专题的文章分享了开放平台的搭建思路。
专题
14842人已学习13篇文章
在产品的商业模式中,广告变现占据了很大的比重,那么广告功能就是产品里面非常重要的功能之一。本专题的文章分享了如何搭建广告投放系统。
专题
15283人已学习12篇文章
服务设计在流程性和系统性的问题解决方面提供很好的思路和方法。本专题的文章分享了如何做好服务设计。
专题
13123人已学习14篇文章
各种大模型和AI绘画的产品层出不穷,在各行业也在尝试进行应用。在这个阶段,AIGC能实现些什么?本专题的文章分享了AIGC的应用。
专题
36448人已学习15篇文章
击溃顾客最后的心理防线,让他们心甘情愿按下购买按钮。
专题
36208人已学习13篇文章
用户分层本身并不是目的,只是实现业务发展的手段方式。