別急著給中國版ChatGPT唱贊歌:“追風者”無緣“星辰大?!?/h2>
1 評論 2812 瀏覽 0 收藏 16 分鐘

ChatGPT所掀起的討論和影響已經在國內外互聯(lián)網圈中不斷蔓延,比如在ChatGPT推出之后,國內企業(yè)如百度等,也在大模型上跟進和發(fā)力。那么,如何理解國內企業(yè)ChatGPT類產品的落地與應用?這其中存在著哪些“虛”或“實”?一起來看看作者的解讀。

文心一言發(fā)布十余天后,爭論仍未有止歇的跡象。

有人給出了“拉垮”的評價,相比于多輪迭代的ChatGPT,文心一言在邏輯推理、多輪對話等方面的表現不盡如人意;也有人認為給文心一言值得肯定,原因是填補了中文互聯(lián)網的空白,以及百度直面競爭的勇氣。

可能最終會像李彥宏在發(fā)布會上所說的:當前文心一言的內測體驗并不能叫作“完美”,發(fā)布是因為有市場需求,“文心一言將建立起真實用戶反饋、開發(fā)者調用和模型迭代之間的飛輪,效果會迅速提升,給你‘士別三日,當刮目相看’的驚喜。”

這里并非想對比文心一言與ChatGPT的差距,而是想要討論這樣一個話題:那些以“中國版ChatGPT”自居的玩家們,到底是“追風者”還是“追趕者”,不同的“初心”顯然對應著不同的結果。

一、中國版ChatGPT的虛與實

國內企業(yè)對ChatGPT的態(tài)度,大致可以分為三個階段:

第一個階段是2023年農歷春節(jié)前。

OpenAI在2022年11月30日推出了聊天機器人ChatGPT,5天時間注冊用戶量就超過了100萬。期間不乏國內媒體的報道,微博等社交網絡上逐漸流行起各種說法:ChatGPT可能將顛覆谷歌,掀起一場搜索引擎的大革命;大學生開始用ChatGPT寫論文,部分高校宣布將禁用ChatGPT……

彼時“中國版ChatGPT”的話題已經在技術論壇里小范圍討論,國內大廠的工程師們大概率有參與其中??捎捎贑hatGPT頻頻被曝出回答錯誤、存在假消息,且商業(yè)化落地的前景不明朗,國內大多數企業(yè)都選擇了緘默。

第二個階段是ChatGPT爆紅后。

時間來到2023年1月末,ChatGPT的注冊用戶破億,成為史上擴散速度最快的應用,這場AI風暴終于吹到了太平洋對岸。國內社交媒體上充斥著ChatGPT的對話截圖,并且出現了“ChatGPT概念股”的說法。

中國的科技大廠們“猛然醒悟”,紛紛開始就中國版ChatGPT表明態(tài)度:百度在2月7日官宣將在3月上線文心一言;騰訊在2月9日回應稱“在相關方向上已有布局,專項研究也在有序推進”;阿里傳出了類ChatGPT應用的對話截圖;京東、網易有道、科大訊飛、小米也先后發(fā)聲將推出相關產品。

第三個階段是文心一言上線后。

可能因為發(fā)布會上的錄屏展示,百度的股價在文心一言發(fā)布當天即下跌10%,一度成為互聯(lián)網上的眾嘲對象,即使李彥宏和百度CTO王海峰均在發(fā)布會上提前打了“預防針”,直言模型目前“訓練不夠充分”。

有趣的是其他科技大廠的態(tài)度。目前申請測試百度文心的用戶已經百萬,超過10家企業(yè)用戶申請調用文心一言的企業(yè)版API。如果說ChatGPT的走紅只是喚醒了國內網民的好奇心,擺出了一副吃瓜群眾的姿態(tài),現在已然被徹底點燃了熱情。但百度文心上線近10天后,并未有第二家企業(yè)官宣。

個中原因恐怕離不開“功利”二字。

在ChatGPT的方向被論證前,國內的大部分投資人和技術領袖并不敢冒險跟進,不考慮短期收益的只有少數派中的少數派;ChatGPT爆紅后,特別是“ChatGPT概念股”出現后,中國版ChatGPT已經成為一種政治正確,大廠們的表態(tài)也就無可厚非;文心一言上線后則是另一個極端,在“肉眼可見”的技術差距面前,暫時收斂鋒芒是否也是一種避開被輿論討伐的選項?

“中國版ChatGPT”或喧囂或冷靜的背后,似乎還有另外一種解釋:在用戶心理閾值最高的時候,跟風放出消息不失為一種聰明的商業(yè)策略,而落實到產品上,終歸還要結合現實需求。就像科大訊飛董事長劉慶峰的觀點:AI要兌現紅利,標準之一就是有看得見摸得著的應用場景。

二、空間換時間的認知陷阱

至于ChatGPT類產品的商業(yè)空間,微軟無疑是最佳的參考對象。

作為OpenAI的大股東,微軟被中國網友們戲稱為“坐在副駕駛上狂飆”,尤其是在ChatGPT的商業(yè)應用上,微軟可謂動作頻頻:1月17日的公開活動上,微軟CEO納德拉表示,計劃將ChatGPT整合進其所有產品;半個多月后,微軟正式推出新版必應,將ChatGPT與搜索引擎融合;GPT-4發(fā)布兩天后,微軟發(fā)布了新功能Copilot,將用于Word、PowerPoint、Excel、Outlook等產品中,可自動生成PPT、自動寫文章……

為何國內企業(yè)并沒有兵臨城下的危機感?最常見的說法是“空間換時間”,中文互聯(lián)網的特殊性,為國內企業(yè)留下了充足的反應時間。譬如晚于ChatGPT三個半月誕生的文心一言,照舊抓住了大把的機會。諸如此類的說辭在某種程度上有其道理,卻也存在一些不可小覷的認知陷阱。

比如中文語料庫的問題。

在不少人的理解中,中文語料庫是ChatGPT難以逾越的壁壘,李彥宏稱“文心一言是更適合中國市場的人工智能模型”,理由正是中文特殊的分詞和語法結構。中文語料庫的建設需要大量的人力、物力和財力投入,同時還需要考慮語料的質量、版權等問題,幾乎是一個天然避風港。

可國內互聯(lián)網巨頭的“數據隔離”也是不爭的事實,盡管在工信部的施壓下,大廠們被迫“拆墻”,但不同平臺的數據仍然很難產生交流和總結,無形中增加了模型訓練的難度。就連文心一言的圖像生成都經被傳出先將中文指令翻譯成英文,再根據英文描述生成圖像,中文語料的現狀可見一斑。

再比如技術上的硬性門檻。

國內并不缺少媲美GPT-3的大模型,這也是很多企業(yè)自信可以開發(fā)出ChatGPT類應用的直接原因,然而算力資源、工程能力、模型迭代策略、調優(yōu)機制等能力的缺失也是不爭的事實。還是文心一言的例子,雖然有ChatGPT這個參考答案,迭代、調優(yōu)的路還是要重新走一遍才行。

一個淺顯的道理,OpenAI在推出ChatGPT前,已經在大模型上默默耕耘了4年時間,期間不知道有多少次的試錯。畢竟一個現象級產品誕生,往往是資源、基礎技術、人才、產業(yè)需求等一系列因素的集大成,國內到底有多少家企業(yè)能夠越過技術上的硬性門檻,目前還是一個未知數。

按照華西證券的測算,百度的文心一言想要達到ChatGPT目前的能力,需要補足的訓練、推理和數據標注成本分別為2.29億元、13.62億元、0.05億元,需要保持年均16億元的投入。

倘若再算上維持正常運轉的人力成本、訓練模型的算力成本、存儲數據的數據中心耗費,百度想要追平OpenAI需要付出相當龐大的投入,遑論其他缺少前期布局的企業(yè)。

就在百度們還在追趕GPT-3.5時,OpneAI已經有條不紊的推出了功能更為強大的GPT-4,并在3月24日宣布部分解除了ChatGPT無法聯(lián)網的限制,正在推出ChatGPT插件,可以訪問訓練數據外的信息,增加一些特定功能,開始了從工具向平臺的進化。

三、“追風者”無緣“星辰大?!?/h2>

最糟糕的并不是做一個“追趕者”,而是“反應遲鈍”的追風者。

早在2020年的時候,OpenAI就借著GPT-3一鳴驚人,隨即在全球范圍內拉開了一場大模型軍備競賽,國內的華為、智源、浪潮、阿里云、百度、騰訊等企業(yè)先后發(fā)布了自家的預訓練大模型品,并不斷從NLP延伸出了雙語、CV、跨模態(tài)等大模型。

而后的一段日子里,來自中國的大模型覇榜各類榜單,學術論文如流水線般生產。一些研究人員以發(fā)論文為己任,鮮有人思考學術以外的價值;企業(yè)對大模型滿懷信心,并試圖推動產業(yè)落地中來變現。最終也僅僅止步于此,沒有一家企業(yè)能創(chuàng)造性地越過大模型到ChatGPT的天塹。

有人在知乎上問道:阻礙國內團隊研究 ChatGPT 這樣產品的障礙有哪些,技術、錢還是領導力?OneFlow創(chuàng)始人袁進輝的回答道出了問題的本質:“需要有遠見且為理想而持之以恒的人?!?/strong>

不可否認的是,“談理想”在國內的商業(yè)環(huán)境中多少有些感性且不切實際,甚至連相應的故事都是“舶來品”:圖靈獎得主Hinton潛心研究神經網絡50多年;斯坦福的李飛飛教授花費6年時間創(chuàng)建了ImageNet數據集;OpenAI最初被定義為非營利性人工智能組織,要向全世界公開分享他們的研究成果……

國內盛行的是另一種商業(yè)故事:張小龍在2010年帶領一個不到10人的團隊,用了不足70天的時間開發(fā)出了微信的第一個版本;出行大戰(zhàn)中勝出的滴滴,曾用四個月的時間拉來了一萬多名網約車司機;2013年才立項測試外賣項目的美團,到了2014年就將外賣送到了全國200個城市……

問題在于,追逐風口、快速創(chuàng)新的打法到了人工智能時代是否依然奏效?不妨借用英偉達CEO黃仁勛的一個比喻:“每家公司都應該知道,未來的軟件開發(fā)有點像煉丹,這是一個MLOps的過程?!逼渲械腗LOps可以翻譯為“人工智能研發(fā)運營體系”,涵蓋開發(fā)、部署、交付驗證三個必不可少的過程。

在中國版ChatGPT的研發(fā)中,國內的企業(yè)已然走了“捷徑”:比如ChatGPT最大的特點就是引入了人類反饋的強化學習(RLHF),即用人工標注的方式,不斷地將結果去反饋給模型,讓模型不斷自我迭代。百度等企業(yè)后來也采用了RLHF模式,并輔以“對話增強、有監(jiān)督精調”等機制,底層架構和技術路徑都與OpenAI相似。

最危險的地方恰恰也在于此。

不少人將ChatGPT比作是移動互聯(lián)網時代的iPhone,意味著ChatGPT只是個開始,將有更多超出固有認知的新事物出現,可能是聊天機器人,可能是“畫圖高手”,也可能是當前還想不到的應用。同時也預示著層出不窮的新風口,凡是風口,皆有虛實,一味跟著別人走路,總有踏空的時候。

李彥宏曾在2021年初的內部信中寫道:“我們熬得過萬丈孤獨,藏得下星辰大海。”冥冥中成了中國企業(yè)面對ChatGPT時的命運寫照:熬不過萬丈孤獨,何談星辰大海?

四、寫在最后

中國版ChatGPT的故事還在繼續(xù),不排除有越來越多的相似產品上線,甚至出現“百花齊放”的局面。

需要警惕的是那些自詡為“國產之光”的追風者,聊天機器人的風口來臨時,迅速整頓人馬開發(fā)類似應用;AI生圖的熱度起來后,快速組建團隊抓住新的契機;而當新的風向標出現時,會再次調轉方向…… 不愿意在底層技術上“苦修”,注定要在風口里兜兜轉轉。

因為“追趕者”仍抱有理想、信念和希望,“追風者”注定只會在風中盤旋,被風勢裹挾。

專欄作家

Alter,微信公眾號:Alter聊IT(ID:spnews),人人都是產品經理專欄作家,互聯(lián)網觀察者。專注于移動互聯(lián)網、智能硬件、電子商務等科技領域。獨立的自媒體人,走在創(chuàng)業(yè)的路上。

本文原創(chuàng)發(fā)布于人人都是產品經理,未經許可,禁止轉載

題圖來自Unsplash,基于CC0協(xié)議

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App

評論
評論請登錄
  1. “追風者”無緣“星辰大海”,但我還是選擇相信中國版??

    來自中國 回復