AI大模型,駛向產業(yè)何方?
今天開年以來,ChatGPT的火爆出圈讓更多人感受到了AI人工智能實際的發(fā)展情形,不少人也在想,AI的時代浪潮是否真的來臨了,畢竟國內許多大廠已經開始在相關領域加強了投入。那么目前,AI如果想實現規(guī)?;涞?,將面臨怎樣的挑戰(zhàn)?目前國內AI大模型的成長發(fā)育,是否已經相對完善?
“AI炒了那么多年,第一次感覺它真的要來了?!眹鴥饶痴搲?,帶有ChatGPT的詞條下,幾乎都會出現一句類似的表述。
ChatGPT是美國人工智能研究實驗室OpenAI基于AI大模型打造的一款智能問答工具,用戶只需在ChatGPT網站頁面的對話框中輸入問題并點擊確認,便可以得到答案。
就是這么一個智能問答工具,在過去的兩周內,以各種形式席卷全球各大社區(qū)、論壇,占據各大新聞頭版頭條。
不同于過去“AI革命”中,專屬于相關企業(yè)與技術人員的搖旗吶喊、獨自狂歡。這次將AI推向風口的卻是C端用戶,這使得ChatGPT實現了快速“出圈”。
一組數據是,ChatGPT今年1月的月活躍用戶數已達1億,成為歷史上用戶增長最快的消費應用。國外一家提供就業(yè)服務的平臺對1000家企業(yè)進行了調查。結果顯示,近50%的企業(yè)表示,已經在使用ChatGPT,30%表示有計劃使用。
國外科技巨頭也紛紛開始布局,例如曾all in元宇宙的Meta發(fā)布了新的大模型系列 —— LLaMA;微軟公司宣布ChatGPT將與旗下瀏覽器融合;谷歌宣布發(fā)布“Bard”AI聊天機器人服務。
ChatGPT帶來的熱潮,同時也涌向了國內市場。
較為明顯的是,百度、騰訊、阿里等紛紛開始布局具體應用。其中,百度宣布將基于文心大模型推出“文心一言”后,400多家公司相繼宣布接入,一度將其港股股價拉高超12%。
另外,在過去的兩周內,諸多以AI大模型為技術底層的廠商,開始獲得資本的青睞。
例如,致力于企業(yè)創(chuàng)新數智化平臺的銜遠科技完成數億元(人民幣)天使輪融資;致力于對話機器人行業(yè)解決方案的竹間智能完成D+輪融資;醫(yī)療交互AI平臺聆心智能完成Pre-A輪融資。
更有已退休兩年的前美團聯(lián)合創(chuàng)始人王慧文,在其朋友圈公開招納技術人才,助其打造“中國版OpenAI;快手前AI核心人物李巖創(chuàng)業(yè)投身AI大模型賽道。
而在學術界,復旦大學自然語言處理實驗室,發(fā)布了國內首個類ChatGPT模型MOSS,公開平臺邀公眾參與內測后,數萬名用戶申請參與內測。
站在底層技術角度來看,從科技巨頭到互聯(lián)網大廠,從創(chuàng)業(yè)屆到學術屆,AI大模型正在成為各方搶灘市場的關鍵。
事實上,AI大模型本質上是通過數據的訓練,進行歸集和表達。這意味著,如果對不同的數據進行訓練,便可以產生不同的模型。拿OpenAI來說,其就是基于底層大模型打造了“對話機器人”ChatGPT。除此之外,其還基于底層大模型打造了Dall-E“繪畫機器人”。
過去多年的一個市場共識是,如果要實現AI規(guī)模化產業(yè)落地,底層AI大模型就必須是一個通用的大模型平臺,廠商根據用戶需求在平臺之上,進行多場景、多領域的模型生產,從而實現具體行業(yè)模型的落地。
對一眾廠商而言,這也是一個新的方向。即AI廠商以“通用模型+產業(yè)模型”不斷賦能企業(yè)、產業(yè),從而加速中國的產業(yè)數字化進程。更為重要的是,這種模式一旦落地成功或將快速實現規(guī)?;驅轭^部AI廠商帶來高回報,擺脫當下AI技術落地難,盈利難的現狀。
那么,AI大模型現在在國內產業(yè)側的成長如何?
一、看見AI大模型
“丫丫意識上傳550W后1.7秒月球危機就發(fā)生了?!边@是電影《流浪地球2》中的一句臺詞。
這個情節(jié)背后隱藏的是,超級AI大模型下的超級智能決策。
在電影的人物設定中,馬兆、圖恒宇都是550系列智能量子計算機的研究員。圖恒宇是為了留住在車禍中去世的女兒圖丫丫,將其“意識”植入初代智能量子計算機550A升級版550C中,試圖迭代出“數字人丫丫”,但由于算力問題,不能處理過多的數據,導致“數字人丫丫”只能迭代出2分鐘的生命。
月球危機下,圖恒宇看到了550C的升級版550W,其超強算力可以讓丫丫“活得更久”。于是圖恒宇偷偷將丫丫的意識植入550W。
但在植入丫丫意識的1.7秒后,計算機開始超負荷運行,這意味著,無法啟動地球上的發(fā)動機,“流浪地球”計劃失敗,地球毀滅。
一個決定性的轉機在電影結尾,圖恒宇在臨死前將自己的“意識”植入了550W,使得其算力正常運行,點燃了發(fā)動機。
其實,在550W量子計算機的超強算力下,AI大模型不斷的計算、學習、訓練,讓原本負責管理空間站的AI系統(tǒng)迭代出自主意識,并為自己取名MOSS。
由于其AI系統(tǒng)的設定便是堅定執(zhí)行延續(xù)人類文明的使命,所以當丫丫的意識植入大模型時,在550W超強算力加持下,極端理性的人工智能遇到了感性的丫丫,MOSS實現了新的進化,感受到了人性的惡,推算出毀滅即拯救,這也就導致了MOSS制造出計算機負荷運載的假象,試圖毀滅地球。
但當圖恒宇的意識的植入大模型后,使得MOSS學習到圖恒宇與丫丫之間的愛與和平,訓練出新的意識形態(tài),即拯救人類。
從某種意義上來說,MOSS最后拯救人類,就是“理想AI大模型”下帶來的智能決策。
實現路徑可以概括為,基于大量的數據集,進行學習、訓練之后,在空間站管理場景中,利用550w量子計算機的算力,將空間站場景數據植入,進行二次訓練,就可以滿足空間站的場景需求,MOSS就是這種需求下的產物。
場景數據喂養(yǎng)后實現二次訓練的模型也可以稱之為場景模型。而當丫丫、圖恒宇意識,即具體場景任務、行為數據植入場景模型中時,便可以給出具體智能決策。
這也是AI大模型規(guī)?;涞氐囊环N路徑。
“中國科幻需要現實意義?!痹趧⒋刃揽磥恚骼说厍虻墓适略O定與現實科技發(fā)展存在著許多共性。
事實上,ChatGPT產業(yè)圖譜中,主要價值點有三層。一是開篇提到的ChatGPT應用程序,將AI模型集成進面向用戶的應用軟件,它們或運行著自己的模型(端到端應用),或依賴于三方模型的API。目前來看,雖然這類應用公司的營收增長得非??欤诹舸媛?、產品差異化和毛利率上卻容易遇到瓶頸。
二是基礎設施提供商,如云廠商或硬件制造商,它們負載著生成式AI模型的訓練和推理。這類廠商贏面較大,將賺取了流經技術棧的大部分資金。以生成式AI為例,有業(yè)內人士預測,其總營收的10%~20%將流向云服務提供商。但有這種能力的廠商屈指可數,門檻高,頭部效應明顯,競爭空間極其有限。
三就是我們重點提到的模型提供商,致力于打造驅動AI產品的底層大模型,它們要么以專有API的形式提供,要么開源提供。但絕大多數大模型廠商都還沒有實現大規(guī)模的商業(yè)化,屬于一片還未真正打開的戰(zhàn)場,彎道超車機會很大。
值得注意的是,在整個AI規(guī)?;涞亓鞒讨?,最復雜的環(huán)節(jié)就是底層AI大模型的搭建。但這恰恰給AI大模型廠商帶來了新的機會。
換言之,想要 實現AI大模型規(guī)?;漠a業(yè)落地,首先需要將整個落地路徑“簡化”。讓AI變得“人人可用”,同時也要滿足具體場景、領域的個性化需求。
二、通用大模型+產業(yè)模型
底層AI大模型的研發(fā)具有數據規(guī)模大、質量參差不齊、模型體積大、訓練難度高、算力規(guī)模大、性能要求高等挑戰(zhàn)。這樣的高研發(fā)門檻,不利于人工智能技術在千行百業(yè)的推廣。
而具有數據、算力、算法綜合優(yōu)勢的企業(yè)可以將模型的復雜生產過程封裝起來,通過低門檻、高效率的生產平臺,向千行百業(yè)提供大模型服務。
各個行業(yè)的企業(yè)只需要通過生產平臺提出在實際AI應用中的具體需求,生產大模型的少數企業(yè)就能夠根據應用場景進一步對大模型開發(fā)訓練,幫助應用方實現大模型的精調,以達到各行業(yè)對于AI模型的直接應用。
彼時,AI大模型就會真正意義上實現產業(yè)化,成為產業(yè)模型。
目前,國內布局AI大模型廠商百度、阿里、騰訊、商湯、華為等企業(yè),正在不斷夯實通用大模型,打造產業(yè)模型,助力AI大模型產業(yè)化。
其中,百度以文心大模型+飛槳PaddlePaddle深度學習平臺;騰訊以hun yuan大模型+太極機器學習平臺;阿里以通義大模型+M6-OFA;華為以盤古大模型+ModelArts,都打造了(自然語言處理)大模型 、(計算機視覺)大模型以及多模態(tài)大模型方面。
可以發(fā)現,主要參與者大多是云廠商,正如上文所言,云基礎設施很有可能是AI大模型這盤棋,最終的最大獲益者。所以,大模型也成了云廠商“的必爭之地”
值得注意的是,各個廠商AI大模型的布局,有所差異。
百度由于多年在AI領域的深耕,其文心大模型涵蓋基礎大模型、任務大模型、行業(yè)大模型的三級體系,打造大模型總量約40個,產業(yè)應用也較為廣泛,例如電力、燃氣、金融、航天等,構建了國內業(yè)界較大的產業(yè)大模型。
目前來看,屬于國內大模型廠商的第一梯隊中的佼佼者。
騰訊產業(yè)化應用方向則主要是騰訊自身生態(tài)的降本增效,其中廣告類應用表現出色。
阿里更重技術,例如M6大模型基于阿里云、達摩院打造的硬件優(yōu)勢,可將大模型所需算力壓縮到極致;另外其底層技術優(yōu)勢還有利于構建AI的統(tǒng)一底層。
目前,主要應用方向是為下游任務提質增效,例如在淘寶服飾類搜索場景中實現了以文搜圖的跨模態(tài)搜索。
華為的優(yōu)勢則在于其訓練出業(yè)界首個2000 億參數以中文為核心的預訓練生成語言模型。目前發(fā)布了盤古氣象大模型、盤古礦山大模型、盤古OCR大模型三項較為重磅的行業(yè)大模型。
可以發(fā)現,在商業(yè)模式上各個廠商都是通用大模型路徑,在通用大模型架構之上,搭建具體行業(yè)模型。映射到產業(yè)層面,即“通用大模型+產業(yè)模型”的路徑。
但具體的產業(yè)化應用有著較為明顯的差異。其實,這與各個廠商喂養(yǎng)的數據有著極大地關系。例如華為的優(yōu)勢在G端,相對應其在氣象、煤礦等央國企領域有大量服務經驗與數據,在數據的計算、學習、訓練下,更容易打造該產業(yè)的大模型。
然而,手握入場券,并不代表能跑到終點。
對于廠商而言,其可以搭建通用大模型,并不意味著其能把通用大模型搭建的好;其有能力打通大模型到產業(yè)模型到具體場景的應用,并不意味著其可以打造出有真正價值的智能決策。
AI大模型產業(yè)化落地的瓶頸需要被正視。
三、“智商”堪憂
如果將產業(yè)模型看成一個公式:2×π+N=?
其中,公式“2×π=6.28318530718……”就是底層通用大模型,“N”則象征著具體場景的數據。公式“2×π+N=?”就是植入具體場景、領域數據后的產業(yè)模型。
在這個公式中,不難發(fā)現的是,π小數點后的數字越精確,得出的結果就越精確,最后產業(yè)模型下的智能決策也就越精確,相對應的計算難度也就越大。另外“N”作為一個變量,需要收集場景下大量有價值的數據。
顯然,計算能力和數據集成,是AI最終做出有價值的智能決策的關鍵,即AI大模型產業(yè)化落地的關鍵。
對于國內的AI大模型廠商而言,這不是一件容易的事情。
1. 計算能力
在提升計算能力方面,首先比起一個人,100個人計算的效率會更高,所以計算人力數量是關鍵,人力數量對應的則是芯片的數量;其次,計算器比紙算會更快,而Excel又比計算器效率更高,所以計算工具的性能改進也是關鍵,對應的則是芯片的性能。AI大模型需要在大量、高性能的芯片加持下,不斷的進行模型訓練,才能更加精準。
目前,英偉達推出的A100/H100是目前性能最 強的數據中心專用GPU。 且市面上幾乎沒有可規(guī)模替代的方案。 包括特斯拉、Facebook在內的企業(yè),都利用A100芯片組建了AI計算集群。
根據市場研究顧問公司Compass Intelligence發(fā)布的AI芯片最新調研報告,全球前5大人工智能(AI)芯片企業(yè)排名依次為NVIDIA英偉達、Intel英特爾、IBM、Google、蘋果。
在性能方面,英偉達是AI大模型芯片選擇的第一順位。
值得注意的是,據國盛證券報告《ChatGPT 需要多少算力》估算,以 ChatGPT在 1 月的獨立訪客平均數 1300 萬計算,其對應芯片需求為 3 萬多片英偉達 A100 GPU。從全球GPU的飽有量來看,擁有一萬顆GPU儲備的企業(yè)屈指可數。
即使有貨,但受困于美國對英偉達GPU產品A100和H100出口限制,目前也很難買到。
針對這一問題,英偉達為了留住難以割舍的中國市場,推出了A100的替代A800。這是國內廠商目前能買到的替代品。
但根據芯片經銷商OMNISKY容天官網信息顯示,英偉達A800GPU數據傳輸速率為每秒400GB,傳輸速率有所下降。英偉達A100GPU傳輸速率為每秒600GB。A800數據傳輸速度降低了30%,性能明顯不高。
還有,訓練通用大模型十分燒錢。據國盛證券報告《ChatGPT 需要多少算力》估算,GPT-3 訓練一次的成本約為 140 萬美元,對于一些更大的 LLM(大型語言模型),訓練成本介于 200 萬美元至 1200 萬美元之間。以 ChatGPT ?3 萬多片 A100的采購量來算,初始投入成本約為 8 億美元,每日電費在 5 萬美元左右。
站在更大的層面看,如果要實現AI大模型最終的產業(yè)化落地,其成本將會高達幾十億甚至上百億。
根據New Street Research 的一項估計發(fā)現,Bing搜索中基于OpenAI的ChatGPT模型可能需要8個GPU才能在不到一秒的時間內響應問題。
按照這個速度,微軟將需要超過20,000臺8-GPU服務器才能將Bing中的模型部署給每個人,這表明微軟的功能可能需要40億美元的基礎設施支出。
燒錢、買不到大量高性能的AI芯片,制約著國內AI大模型的計算能力。
2. 數據集成管理
中外數據質量有著巨大差異性。
IDC在一項有關“中國數據集成與數據質量市場”調查的白皮書中指出,大部分中國企業(yè)數據集成項目難以達到預期的原因在于數據質量問題。
從市場發(fā)展環(huán)境方面,可以看到的一些問題是。國內企業(yè)IT系統(tǒng)大量建設,數據環(huán)境較為復雜,造成數據的重復、不一致、格式混亂等問題。這些低質量的數據,即便在完成數據集成之后,得出的也可能是質量不高的信息。
一組數據是,72%的接受調查的中國企業(yè)存在重復數據,60%的企業(yè)存在不完整數據。
另外,國內企業(yè)普遍存在跨系統(tǒng)利用數據、系統(tǒng)間數據傳遞不及時、以及業(yè)務指標理解不一致也使得數據質量出現問題。
“如果是靜態(tài)數據,則要求完整、準確、一致,格式規(guī)范;如果是動態(tài)數據,則要求能被及時調用,快速更新?!痹贗DC中國高級分析師劉飛認為,這是衡量數據質量好壞標準。
然而,在國內由于企業(yè)數字化程度較低,甚至許多企業(yè)停留在最原始的信息化階段,導致標準化、規(guī)范化程度較低,集成管理困難。而在歐美,企業(yè)標準化程度高,相對應的數據也較為標準化,數據質量高。
數據挖掘方面,挖掘程度不同,一般國外把數據挖掘技術應用于各個行業(yè)產業(yè)的過程中,建立不同的數據挖掘模型。國內主要應用于各個行業(yè)儲層評價、施工方式的選擇、生產指標的預測以及各個行業(yè)系統(tǒng)的診斷。另外,國內多專于橫截面式的數據分析。國外更注重同一批樣本量的縱向比較和追蹤研究。
在數據研究方面。由于國外注重數據研究的意識,國外數據治理研究主要集中在理論探索、模型框架以及實踐應用三個方面; 國內相比之下,技術研發(fā)的探索能力較弱一些,所以側重于理論分析尚且缺乏模型與框架等應用研究。
在數據共享方面。國外許多國家都有很多大型的科學數據共享平臺,特別是英國、美國,并且許多平臺都對自己的數據有一定的質量要求。且國外企業(yè)之間也有著良好的數據生態(tài)。
目前國內的數據共享平臺發(fā)展還不夠成熟,國內主要的數據平臺是中科院科學數據共享工程中開發(fā)的多個學科數據共享平臺。且企業(yè)之間數據生態(tài)并沒有像國外那么開放。
較為混亂的數據環(huán)境、缺乏數據深度和整體性研究以及數據生態(tài)的不成熟等問題,使得國內產業(yè)數據在質量、數量上普遍存在一些問題,導致場景無法真正實現數字化,且在短時間內,無法通過技術、管理手段迅速改善。比起歐美國家,仍有很長一段路要走。
總結來看,以目前國內AI大模型的計算能力以及數據集成管理能力,其最后產業(yè)化落地的智能預測很有可能價值點較低。即使做出語音交互機器人,可能也并不“聰明”。
但即使是這樣,我們仍需看到AI 大模型對中國產業(yè)發(fā)展的巨大意義。
四、在中國,談論AI模型的必要性
“以數據為關鍵要素,以價值釋放為核心,以數據賦能為主線,對產業(yè)鏈上下游的全要素數字化升級、轉型和再造的過程”這是產業(yè)數字化的官方定義。
簡單來說,產業(yè)數字化的前提就是讓數據從資源化奔向資產化。
好比煤炭、石油、天然氣等,只有少量存儲則不可能被稱做資源,只有在規(guī)模足夠大,具有使用價值之后,才會被稱做資源。
后期則需要對其進行開采和加工,自然需要組織、制度、流程等來保證工作的有序運轉,并使資源轉化為資產。這時,煤炭、石油、天然氣的價值才能釋放出來。
數據資源也是同樣的道理。當數據資源達到一定規(guī)模,就需要組織對其進行開發(fā)和利用,成為數據資產,釋放其價值。
在當下的大數據時代,企業(yè)愈發(fā)重視數據的采集,這其中不乏一些企業(yè)擁有龐大且豐富的數據集。然而,國內企業(yè)大規(guī)模數據的開發(fā)和利用的鏈路十分復雜,普遍面臨數據“用不起來”和“用不好”的問題。
但AI大模型本身對應的就是數據的高度歸集和表達,其就像一條快速通道,高度歸集代表入口,表達則是出口,讓數據從生產到消費的路徑變得簡單,數據可以便捷、快速地進行開發(fā)和利用,釋放數據的價值。
加之,在AI大模型+產業(yè)模型下,大模型可以實現具體場景、領域數據的學習、訓練。所以在產業(yè)具體場景下的數據將更有價值,即更加貼合場景需求,可以直擊場景痛點。
可以預見,隨著產業(yè)模型的落地,將使得企業(yè)數據價值得到最大釋放,實現企業(yè)數字化轉型、再造,加速產業(yè)數字化滲透,推動產業(yè)數字化歷程。
另外,AI大模型的隨著時間的推移,廠商的利潤將越來越高。
根據相關機構預測,至2030年為止,AI訓練成本將持續(xù)以每年70%的速度降低。
舉例來說,要將一款大型語言模型訓練至GPT-3 (Generative Pre-trAIned Transformer 3,生成型預訓練變換模型-3)等級,2020年得花費近460萬美元,2022年驟降至45萬美元,成本節(jié)約近90%。
這對于以往落地難、盈利難的AI廠商而言,無疑是一塊巨大的蛋糕??梢姡诮洜I者,于使用者,于產業(yè)發(fā)展,AI大模型的布局極其重要。
除此之外,在國家層面,AI大模型在今年兩會上亦被提上了新高度。
“ChatGPT之所以引起關注,在于它是一個大模型,對應大數據、強計算、好算法。踢足球都是盤帶、射門,但要做到梅西那么好也不容易……要達到ChatGPT的效果,可能還有工作要做。”
科技部部長王志剛希望國內的科研院所、企業(yè)、廣大科研人員能有進一步發(fā)展和進步。
而這是他第二次談及AI大模型。
總體來看,AI大模型已然成為各個國家、企業(yè)發(fā)展的戰(zhàn)略要地。已經到了不得不重視的地步。
寫在最后
回歸技術本質來看,ChatGPT不是一個新鮮的事物,AI大模型更不是一個突破性的技術,但ChatGPT卻讓其實現了現象級的爆發(fā),在當下AI大模型風口下,我們是否應該思考一些更加深刻的問題,除了軟硬件、技術,中國式AI到底缺少什么?或許這才是問題的根源。
技術更迭,已不是壁壘,國產式AI需要的是產品的創(chuàng)新思維,以及對需求的產品變現能力。這種亟需具備的特質,適用于所有領域。
作者:斗斗
來源公眾號:產業(yè)家(ID:chanyejiawang),專注深度產業(yè)互聯(lián)網內容
本文由人人都是產品經理合作媒體 @產業(yè)家 授權發(fā)布,未經許可,禁止轉載。
題圖來自Unsplash,基于 CC0 協(xié)議
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
- 目前還沒評論,等你發(fā)揮!