不必神化ChatGPT,它很牛,但中外差距沒那么大

7 評論 10448 瀏覽 11 收藏 25 分鐘

就像以前的互聯(lián)網(wǎng)剛出現(xiàn)時所帶來的變革一樣,如今ChatGPT的出現(xiàn),讓AI成為新一輪技術爆發(fā)的奇點成為可能。各大科技公司紛紛投入了對這項技術的研究中,然而,ChatGPT雖然很厲害,卻不必神話它。

“ChatGPT的意義不亞于PC或互聯(lián)網(wǎng)的誕生”,比爾蓋茨對這個新風口不吝贊譽。

裁員潮下一片慘淡的硅谷,因為ChatGPT再次燃起了希望之光。

微軟斥資100億美元投資OpenAI,并計劃將ChatGPT融入旗下全線產(chǎn)品。2月4日,微軟融合ChatGPT-4的Bing已經(jīng)短暫上線,速度之快讓人咂舌。

圖:融入ChatGPT的Bing

而為了應對微軟激進的布局,谷歌緊急地召回了佩奇和布林兩位創(chuàng)始人,并在上周也開始內(nèi)測類似的產(chǎn)品Apprentice Bard。同時,谷歌還向OpenAI的競爭對手Anthropic投資近4億美元,以完成微軟和OpenAI類似的綁定。

中國科技公司也在紛紛跟進,一波類似于2016年AlphaGo的熱潮又一次掀起。

2月7日,百度公布了自家類ChatGPT產(chǎn)品的名字“文心一言”,并預計在3月推出相應的產(chǎn)品。

2月8日,阿里巴巴也透露,聊天機器人ChatGPT目前處于內(nèi)測階段。

同日,網(wǎng)易有道CEO周楓也獨家向光錐智能確認,網(wǎng)易有道未來或將推出ChatGPT同源技術產(chǎn)品,應用場景圍繞在線教育。

2月9日,騰訊也表態(tài)正有序推進ChatGPT和AIGC相關方向的專項研究。

一時間,不僅科技圈無人不談ChatGPT,甚至有不少人也開始用其面向普通用戶賺錢。瑞銀預測,ChatGPT的月活躍用戶在今年1月份達到了1億,它完成這個目標只用了2個月,而在它之前,最快的TikTok大概花了9個月,這讓ChatGPT成為迄今為止增長最快的消費者應用。

在此之前,AI產(chǎn)品更多是針對B端的產(chǎn)品,ChatGPT也打破了to B到to C的圈層壁壘。

當然,ChatGPT的偉大,更重要的還是它讓通用型人工智能進一步成為可能,并降低了這項技術的進入門檻,讓更多開發(fā)者能夠以低成本的方式在ChatGPT的基礎上開發(fā)專屬應用,讓AI改造世界的可能性進一步提升。

可以說,就像25年前剛剛萌芽的互聯(lián)網(wǎng)正準備對全球帶來翻天覆地的變革一樣,如今ChatGPT的出現(xiàn),讓AI成為新一輪技術爆發(fā)的奇點成為可能。

但是,光錐智能在和中國人工智能行業(yè)從業(yè)者交流后,發(fā)現(xiàn)不少技術從業(yè)者反而不如圈外如此狂熱。這是因為,漸進式技術進步到今天,并非一蹴而就,技術從業(yè)者一直都在保持著密切的觀察和技術跟進。

ChatGPT很牛,但不要神化它。

01 硅谷只剩AI了

談起ChatGPT,我們?nèi)匀灰獜墓韫乳_始。和互聯(lián)網(wǎng)、Web3、元宇宙等之前大多數(shù)具有革命或非革命意義的技術突破一樣,ChatGPT仍然來自于硅谷。

但和之前硅谷各項技術方向百家爭鳴不同,這個時間點的ChatGPT更像是硅谷沒有選擇的選擇。

2022年,硅谷就經(jīng)歷了一波大裁員,并波及了幾乎所有的科技公司。到了2023年2月,雖然冬天的氣溫已經(jīng)有所回升,但硅谷的寒意卻還沒有褪去。

據(jù)trueup.io統(tǒng)計數(shù)據(jù),在2023年剛剛過去的這一個月,全球326家科技公司累計裁掉了106950人,其中大頭都在硅谷,而且打擊面還非常廣泛,元宇宙、芯片、自動駕駛和SaaS都是重災區(qū)。

一直以來,裁員都是一個行業(yè)不景氣的直接表現(xiàn)。

以Wbe3為例,Coinbase在2023年1月計劃裁掉公司20%的員工,這是美國第一家上市的合規(guī)加密交易平臺,且這家公司已經(jīng)在去年6月裁掉了18%的員工。

研究公司PitchBook的數(shù)據(jù)顯示,在2022年第四季度,Wbe3行業(yè)的風險投資就已跌到了這兩年以來的最低水平,比2021年同期下降了75%。

在芯片領域,美光、格羅方德、英特爾等巨頭無一幸免,其中泛林集團裁員1300人,因特爾下調(diào)包括CEO在內(nèi)的管理人員薪酬,并裁員數(shù)百人。SaaS領域,Salesforce在1月4日宣布裁員8000人,約占全體員工的10%。自動駕駛方面,包括Waymo、Crusie、圖森未來、無人車配送公司Nuro都有裁員的消息傳出。

除此之外,曾經(jīng)被傾注下一代互聯(lián)網(wǎng)希望的元宇宙也終于走到了拐點。

去年11月,Meta確認了成立18年來首次大規(guī)模裁員,扎克伯格向被裁員工道歉,“我錯了,我要為此次裁員,以及我們是如何走到今天這個地步負責?!?/p>

投資人也不再看好Meta的元宇宙未來,美國投資公司Altimeter Capital向Meta發(fā)表公開信,呼吁公司削減20%的員工成本,并將「元宇宙」項目的支出限制在每年50億美元。

而相比于一頭扎入元宇宙之后又船大難掉頭的Meta,涉足稍淺的微軟則果斷選擇了棄舊從新。

首先,微軟對元宇宙相關業(yè)務進行了大刀闊斧的裁剪,其宣布將在3月10日關閉2017年收購的社交平臺AltspaceVR,并有可能擺脫混合現(xiàn)實工具包(MRTK)團隊。

同時,微軟又在AI方面大力投入。1月初,微軟就計劃向OpenAI投資100億美元,然后宣布要將包括Bing搜索、Office、Azure在內(nèi)的旗下全線產(chǎn)品整合ChatGPT。到2月7日,微軟已經(jīng)在Redmond召開了整合ChatGPT的Bing發(fā)布會。

其實從ChatGPT面世第一天開始,ChatGPT顛覆傳統(tǒng)搜索的觀點就已經(jīng)不脛而走。所以面對微軟激進的布局,谷歌2月6日宣布推出一款聊天機器人Bard來與ChatGPT競爭,谷歌云計算部門也在開展一個名為“Atlas”的項目。

2月7日,谷歌向ChatGPT的競爭對手Anthropic投資了約3億美元,獲得了10%的股份,這讓谷歌和Anthropic形成了類似微軟與OpenAI的綁定關系。

除了谷歌和微軟之外,在ChatGPT上線前三個月,Meta其實也曾發(fā)布過一款類似的聊天機器人,只是并沒有獲得太多影響力。用Meta首席人工智能科學家雅恩?勒昆(Yann LeCun)的話說,“Meta的Blenderbot讓人覺得很無聊”。

相應的,亞馬遜也已經(jīng)將ChatGPT應用到了包括回答面試問題、編寫軟件代碼和創(chuàng)建培訓文檔等工作職能中。一名亞馬遜員工在Slack上表示,亞馬遜云部門已經(jīng)成立了一個小型工作組,以更好地了解人工智能對其業(yè)務的影響。甚至,連蘋果都宣布要在下周召開內(nèi)部AI峰會。

如今的硅谷,AI已經(jīng)成為了絕對C位。

這種轉向其實也表現(xiàn)在投資機構的動態(tài)上,2021年12月,紅杉資本將自己在Twitter上的簡介從“幫助有冒險精神的人創(chuàng)建偉大的公司”改成了“從想法到落地,我們幫助富有冒險精神的人打造偉大的DAO?!?022年,Web3賽道火熱,紅杉在2022年1月1日-4月26日,以大概每周一家的速度投資了17家Web3公司。

但變化發(fā)生在去年9月,紅杉資本發(fā)布了一篇文章《生成式AI:一個創(chuàng)造性的新世界》。其中寫道,生成式AI有可能創(chuàng)造數(shù)百萬億美元的經(jīng)濟價值。

PitchBook的一項統(tǒng)計數(shù)據(jù)顯示,2022年投資圈向生成式AI公司共投入13.7億美元(折合人民幣約93.69億元),幾乎達到了過去5年的總和。這些投資中不僅包括OpenAI、Stability AI這樣的頭部企業(yè),也包如Jasper、Regie.ai、Replika等初創(chuàng)企業(yè)。

整體上,從投資人到大企業(yè),再到創(chuàng)業(yè)者,一場關于AI 2.0的大幕已經(jīng)拉開。

02 中美差距沒那么大

從硅谷到中國,ChatGPT的熱度有增無減。

畢竟一直以來,關鍵的技術革新都發(fā)生在硅谷,這兩年中國尖端技術又一直面臨卡脖子的問題。所以在ChatGPT出現(xiàn)之后,大家最關心的還是當國外技術已經(jīng)開始商業(yè)化落地的時候,國內(nèi)的進度到底如何,差距又有多少?

2月7日,百度對外公布了自家類ChatGPT產(chǎn)品的名稱“文心一言”,英文名叫ERNIE BOT,目前,文心一言正在做上線前的沖刺。

“文心一言”一經(jīng)透露,便迅速登上各大平臺熱搜,百度股價一度漲超17%,市值增長約700億港元。很明顯,市場對于一個中國版的ChatGPT已經(jīng)期待太久。

之前,有觀點認為國內(nèi)外差距大概在兩年左右。但云知聲研發(fā)副總裁劉升平認為,實際上的差距可能沒有這么遠。兩年的說法是因為GPT-3是在兩年前公布的,但其實自GPT-3發(fā)布之后,國內(nèi)許多企業(yè)就已經(jīng)跟進在做類似的大模型了?!皩嶋H差距并沒有那么大,大概在一年左右?!?/p>

小冰公司CEO李笛也向光錐智能提到:“國內(nèi)人工智能技術不像芯片、操作系統(tǒng)一樣落后于國外,相反它應該是最接近國際的?!?/p>

“國內(nèi)外的差距主要是一種思維上的差距?!崩畹颜J為,國內(nèi)對技術創(chuàng)新這件事鼓勵得不夠充分,如果一個公司耐得住寂寞,那它無論在哪個方向都是OK的。

事實上,國內(nèi)大廠基本都具備訓練大模型的能力。比如百度這次發(fā)布的文心一言,就和百度文心大模型一脈相承。

百度在發(fā)布文心一言名字的時候還特意提到,在人工智能四層構架中有全棧布局,包括底層芯片、深度學習框架,大模型以及最上層的搜索等應用。擁有產(chǎn)業(yè)級知識增強文心大模型ERNIE,具備跨模態(tài)、跨語言的深度語言語義理解與生成能力。

同樣的,騰訊也有類似混元AI大模型,在此基礎上,騰訊推出了HunYuan-NLP 1T大模型并一度登頂國內(nèi)最權威的自然語言理解任務榜單CLUE。此外,像阿里有“通義”大模型,華為有盤古大模型,國家隊中科院自動化研究所有“紫東·太初”等等。

簡單來說,國內(nèi)大廠基本都有做NLP預訓練模型的能力,甚至許多專業(yè)能力還處在世界領先的水平。

比如騰訊的混元大模型在2022年11月公布了一項最新進展,它們實現(xiàn)萬億級NLP模型,可以用256張卡,最快1天內(nèi)完成訓練,成本相比原來降低1/8。

作為對比,ChatGPT訓練一次的成本高達1千萬美元,這是一般企業(yè)無法承受的。小冰公司CEO李笛算過一筆賬:“如果按照ChatGPT成本來考量的話,每天我要燒3億人民幣,一年要燒一千多億?!?/p>

而騰訊通過課程學習、MOE路由算法、模型結構等方式優(yōu)化之后,讓更多企業(yè)能夠承擔得起訓練自己的NLP模型的成本。

除此之外,像在專利儲備上,根據(jù)statista2021年的數(shù)據(jù),百度和騰訊都名列世界前列。

另一方面,就ChatGPT而言,它的技術原理并不新鮮。

Yann LeCun提到:“就底層技術而言,ChatGPT并不是特別創(chuàng)新的,它不是革命性的,盡管這是公眾對它的看法。”他指出,除了谷歌和Meta,還有6家初創(chuàng)公司基本上擁有與它非常相似的技術。ChatGPT是一項集體努力,因為它匯集了多方多年來開發(fā)的多項技術。

李笛也提到,大模型對應的技術理念已經(jīng)誕生好幾年,無論是國內(nèi)還是國外,使用這種技術理念訓練出來的大模型已經(jīng)很多,只是在具體fine tune(微調(diào))的過程中專注的領域有所不同。

做個不恰當?shù)谋扔?,ChatGPT就像原子彈一樣,它的原理已經(jīng)被寫在了教科書里,而大多數(shù)國家仍然無法實現(xiàn),更多是因為工程性的問題。比如千億規(guī)模的數(shù)據(jù)從哪里來?如何進行數(shù)據(jù)標注,具體標注哪些數(shù)據(jù),標注多少,這些數(shù)據(jù)又如何進行組織訓練等等。

而這些問題也都沒有在OpenAI的論文中得到公布,需要企業(yè)在自己的模型訓練中去嘗試和摸索,然后形成經(jīng)驗,積累成自己的know-how。

03 不要神化ChatGPT

雖然在底層技術上,國內(nèi)外其實并沒有想象中那么大的差距。但當大家看到國外如火如荼的技術落地時,也會擔心國內(nèi)在這方面掉隊。

對于ChatGPT這樣技術邏輯清晰的產(chǎn)品而言,慢一點并不影響結果。但如果產(chǎn)品差,則表現(xiàn)在具體工程問題的解決能力上,這些部分要摸索,要踩坑,要形成經(jīng)驗都需要漫長的時間,這背后反映的是技術水平的問題。

相比于歐美以英文為主的語言環(huán)境,中文是表意文字,在抽象概括和邏輯能力上天生不及英文。除此之外,國內(nèi)互聯(lián)網(wǎng)的語料也相對缺乏,沒有英文互聯(lián)網(wǎng)那么大的數(shù)據(jù)積累。

所以有業(yè)內(nèi)人士表示,對目前國內(nèi)的類ChatGPT產(chǎn)品發(fā)展而言,重要的不是模型,而是數(shù)據(jù)。

“自然語言處理需要經(jīng)過一個非常嚴密的推理過程?!崩畹烟岬剑骸按竽P湍撤N意義上代表一種暴力,即把大量的數(shù)據(jù)壓縮到一個黑盒里面,然后提取出來,這意味著大家在算力有一定保障的前提下,可以有機會用之前沒有用過的方法去完成?!?/p>

另一方面,ChatGPT確實是革命性的存在,但卻并不代表它就是今后NLP領域的唯一方向。

首先是ChatGPT的技術發(fā)展,今天最主要的技術在于,一個模型建壓好之后,如何從里面很好地提取數(shù)據(jù),目前還有很多新方法沒有嘗試,所以不排除未來用更小的模型達到很好效果的可能。

李笛提到,現(xiàn)在整個行業(yè)都在追求這種可能,因為模型參數(shù)太大,一定意味著成本非常高,以及各種各樣的其他問題?!敖裉旒夹g差異還遠遠沒有達到成為不同技術流派的程度,也還遠遠沒有到說就按應用場景去劃分這樣一個程度?!?/p>

其次是從整個NLP的技術路線來看,目前主要有兩種主流技術路線,分別是以谷歌BERT為代表的雙向預訓練語言模型+fine-tuning(微調(diào)),和以OpenAI的GPT為代表的自回歸預訓練語言模型+Prompting(指示/提示)。

在ChatGPT發(fā)布之前,BERT一直是業(yè)內(nèi)主流的技術方案,它之所以被ChatGPT搶了風頭,是因為它無法像GPT一樣用一個模型解決所有問題,沒有表現(xiàn)出通用型人工智能的潛力。

但實際上,BERT在許多具體的場景下?lián)碛袃?yōu)勢,比如在特定場景下,BERT可以用更小的數(shù)據(jù)量(ChatGPT是在3000億單詞的語料基礎上預訓練出的擁有1750億參數(shù)的模型),更低的訓練成本實現(xiàn)同樣的性能。

比如在醫(yī)院內(nèi)部這樣一個特定場景,一方面它用不起千億規(guī)模的模型,ChatGPT在醫(yī)院場景就屬于殺雞用牛刀,醫(yī)院也無法負擔部署ChatGPT的成本。另一方面,ChatGPT的模型是基于公開數(shù)據(jù)訓練的,但醫(yī)院的數(shù)據(jù)并不存在公共網(wǎng)絡上,所以面對醫(yī)院的問題,ChatGPT可能無能為力。

但BERT卻能夠適應這樣的場景,它可以以更小的數(shù)據(jù)量,更低的成本,針對醫(yī)院的數(shù)據(jù)和場景針對性地訓練出的模型,在解決具體問題上比ChatGPT更加得心應手。

這其實就是一個所有領域都涉獵的全能型選手和深耕特定領域的專家之間的區(qū)別。即在數(shù)據(jù)確定的特定場景,BERT更有優(yōu)勢。而在沒有明確數(shù)據(jù)和目標,面向開放式的應用場景,ChatGPT則更合適。

當然,具體到國內(nèi)企業(yè)的商業(yè)化來說,大模型需要大量的數(shù)據(jù),高昂的訓練成本,這些都不是一般企業(yè)能夠承擔的,因此它注定了是巨頭的游戲。

在騰訊研究院近期發(fā)布的《AIGC發(fā)展趨勢2023》報告中就梳理了目前AIGC產(chǎn)業(yè)生態(tài)體系的三層構架,包括以預訓練模型為主的基礎層;以垂直化、場景化、個性化模型為主的中間層;和以圖像、語音、文字生成等具體AIGC應用為主的應用層。

圖:騰訊研究院《AIGC發(fā)展趨勢2023》

其中,如百度、騰訊、OpenAI這樣的大公司將專注于做預訓練模型,對這些企業(yè)來說,他們一方面能夠將大模型的能力整合到自己的產(chǎn)品線中,直接面向廣大的用戶;另一方面又能夠通過API為中小企業(yè)提供能力調(diào)用,在具體場景中落地。

面對這樣的生態(tài)架構,一位知名機構投資人在考察過硅谷的ChatGPT項目后向光錐智能表示:“創(chuàng)業(yè)公司的機會在于,在開源技術的基礎上,做具體的應用場景。尤其是可以把幾種具體技術結合在一起,比如數(shù)字人和ChatGPT結合,自動生成視頻,用于金融、客服等特定場景下的應用。”

但這也會面臨一些問題,即如果大家都調(diào)用同一個模型的能力,又落地在同一個細分場景,那必然會面臨同質(zhì)化的問題。

所以劉升平認為:“ChatGPT適合創(chuàng)業(yè)公司進入市場初期的冷啟動,即通過ChatGPT提供服務,然后逐步積累數(shù)據(jù),待有了一定數(shù)據(jù)積累之后再利用BERT訓練專用模型,以此來建立自己的技術壁壘和護城河,同時也提供差異化的服務,和同行拉開差距?!?/p>

所以,無論是從技術,還是從商業(yè)化的角度而言,ChatGPT和BERT從來不是一個非此即彼的問題,而是一個術業(yè)有專攻的問題。

此外,劉升平也提到,對于中小公司而言,如果沒有能力去研發(fā)類似ChatGPT的通用大模型,那也可以考慮研發(fā)類似ChatGPT的行業(yè)版模型,用更少的參數(shù)量,更多的行業(yè)數(shù)據(jù),在行業(yè)問題上達到或超過ChatGPT的效果。

“我認為到目前為止,人工智能在To C和To B上尚未出現(xiàn)一個放之四海而皆準的商業(yè)模式?!?/p>

李笛提到,AI現(xiàn)在還出其實還處在一個相對比較早期,甚至可以稱之為蠻荒時代,很多理念都還處在特別特別原始的狀態(tài),所以可能每年我們回顧過去,都會覺得在顛覆自己。

“就像前幾年NIIPS大會上有人開玩笑說過的大模型煉丹,現(xiàn)在的大模型就像大家拿到了一個好的玩具,但不知道這個玩具還能吐出什么令人驚訝的東西?!?/p>

在2016年,AlphaGo擊敗李世石時,我們也曾以為AI時代已經(jīng)來臨,它會在許多領域將人類替代掉,我們也曾為此恐慌和興奮,但實際上如今將近10年過去了,AlphaGo并沒有改變世界,甚至沒有改變?nèi)魏稳恕?/p>

所以,何妨讓子彈再飛一會兒呢?

作者:周文斌

來源公眾號:光錐智能(ID:guangzhui-tech),前沿科技,數(shù)智經(jīng)濟。

本文由人人都是產(chǎn)品經(jīng)理合作媒體 @光錐智能 授權發(fā)布,未經(jīng)許可,禁止轉載。

題圖來自Unsplash,基于 CC0 協(xié)議。

該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務。

更多精彩內(nèi)容,請關注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 進來這里不是看文章的,根本沒打算看。就想來評價一下,作者自稱AI自媒體,可就連AI和ChatGPT是什么都不知道,現(xiàn)在真的是阿貓阿狗都能發(fā)文章,都能自稱老師了

    來自美國 回復
  2. 這位作者應該關注的是應用層面,從別人家衍生而來的應用層面,確實并沒有太大差距,例如蘋果換個殼,可以叫雪梨手機,然后可以說不必神化蘋果,我們的雪梨也不錯。

    來自廣東 回復
  3. “但中外差距沒那么大”,半句話足以看透作者并不懂AI和什么是ChatGPT

    來自河北 回復
    1. 說的對啊 作者在這尬吹 真的看得我一臉問號

      來自北京 回復
  4. 不敢茍同,之前使用過百度的文言,總體弱于3.0版本的體驗,而且應該使用了不少英文的數(shù)據(jù)庫和模型,對中文的理解能力存在不少瑕疵,但會比ChatGPT強,應該有專門的優(yōu)化過,因此個人認為兩年左右的差距是比較中肯的。此外加速追趕除了技術人員的努力外很重要的一點是能否讓國內(nèi)龐大會網(wǎng)民共同參與,因此能否長時間保持免費就是一個重要前提。

    來自福建 回復
  5. 無論是簡中網(wǎng)可以投喂的素材量和素材有效性,AI回答對敏感性的處理,訓練模型的滯后程度。一個不談,只敢在在語言差異性上下筆墨??梢娨话?/p>

    來自云南 回復
    1. 洗洗睡吧,原諒我這么不客氣

      來自廣東 回復