国产伦精品一区二区视频,百度影院

搜索

APP

起點課堂會員權益

職業(yè)體系課特權

線下行業(yè)大會特權

個人IP打造特權

30+門專項技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導直播

12場專業(yè)技能直播

會員專屬社群

榮耀標識

開通會員

發(fā)布

注冊 | 登錄

尋找智能飛輪：從數(shù)據(jù)枯竭到多模態(tài)再到自生成

琢磨事

2023-09-01

0 評論 2483 瀏覽 2 收藏

🔗 技术知识、行业知识、业务知识等，都是B端产品经理需要了解和掌握的领域相关的知识，有助于进行产品方案设计和评估

究竟什么是智能飛輪？什么樣的領域、什么樣的要素影響下，智能飛輪更可能出現(xiàn)呢？這篇文章里，作者就發(fā)表了他的看法和見解，一起來看看作者得出了什么樣的結論。

在前面開源大模型LLaMA 2會扮演類似Android的角色么？我們提到過AlphaGo基于數(shù)據(jù)飛輪，達到了人工智能一個現(xiàn)在還后無來者的高度，它用自己生成的數(shù)據(jù)訓練自己，迅速達到圍棋領域高點，遠超人類。

但實際上用數(shù)據(jù)飛輪來形容這個過程有點以偏概全，數(shù)據(jù)飛輪是智能飛輪的一個部分。我有個做人工智能算法的朋友經(jīng)常把自己的工作形容為大號煉丹師，按照這個類比智能飛輪是什么呢？基本上是九轉(zhuǎn)金丹的方子（算法）、爐子（算力）和材料（數(shù)據(jù)飛輪）的綜合。拿到了大概率煉出九轉(zhuǎn)金丹，而吃了后基本立刻成仙。

那智能飛輪到底是什么，有那些關鍵影響要素，什么樣的領域更可能出現(xiàn)新的智能飛輪呢？

一、智能飛輪

尋找智能飛輪：從數(shù)據(jù)枯竭到多模態(tài)再到自生成

（AlphaGo的數(shù)據(jù)飛輪）

純粹從技術角度看智能飛輪和經(jīng)常說的算力、算法、數(shù)據(jù)三要素相關。（比技術更關鍵的是場域參見：到底什么是OpenAI成功的關鍵點，到底誰能干好大模型？這里不重復了。）算力基本上依賴于資本，算法依賴于團隊，數(shù)據(jù)就復雜些，不單是有錢就行的。

做了8年产品经理后，我是这么看产品经理的

我个人是从非常初级的产品经理做起，再到负责一个大产品的项目管理，现在有幸跳出了日常基础的工作更多的去看产品的PMF，product strategy...

查看详情 >

從智能飛輪的視角來看，算力確實是煉丹爐、算法決定了這個輪子多大或者說到底是個什么樣的輪子，數(shù)據(jù)飛輪則決定了智能飛輪轉(zhuǎn)不轉(zhuǎn)的起來。比如AlphaGo轉(zhuǎn)起來了，但局限于圍棋；chatGPT還沒轉(zhuǎn)起來，如果轉(zhuǎn)起來，世界整個會被轉(zhuǎn)進去，因為它這個輪子太大了，涵蓋了世界太多方面的內(nèi)容。

算力算法和過去其它商業(yè)場景的其實類似，人工智能與其它不同的核心就在于數(shù)據(jù)。壞消息是數(shù)據(jù)因為生產(chǎn)和消費的失衡而潛在的很快會枯竭。

把模型訓練看成消費端，把人和物的所有行為看成生產(chǎn)端，那消耗的速度顯然大于生成的速度。幾十年積累的數(shù)據(jù)可以在幾次訓練中被消耗掉。

而數(shù)據(jù)的生成并不像想的那么容易。

二、有效數(shù)據(jù)從那里來？

并不是所有的數(shù)據(jù)都對模型有用。比如我們訓練小愛同學這樣的喚醒詞時，如果你有海量數(shù)據(jù)但都是鐵嶺人的，那不管數(shù)據(jù)多到什么程度，訓練結果到了廣東都肯定不好使。

所以數(shù)據(jù)首先要有效，其次才是海量。

對于人工智能語境里的數(shù)據(jù)，用玄學和哲學一點的視角可能更容易抓到關鍵。

假設我們有一個“元真”世界，元真世界里面只有本質(zhì)，比如圓的規(guī)律周長、面積、原點等的關系這類，而我們真實的世界其實是本質(zhì)的各種表現(xiàn)（希臘先哲管這個叫：蒼白摹本）。

現(xiàn)在大模型是通過海量的現(xiàn)實數(shù)據(jù)反向逼近本質(zhì)和元真世界，那這個時候獲取的現(xiàn)實表達種類越全，那無疑的逼近的距離就越近。比如爬行動物種類給的越多，每個種類下給的特征越豐富，模型就越能找到爬行動物本質(zhì)的部分并囊括它。只給一條鱷魚或者全給鱷魚就很難逼近到爬行動物的這個本質(zhì)。

這是智能飛輪中最大的挑戰(zhàn)，可以花錢把過往的數(shù)據(jù)整理出來都給模型，問題是然后呢？

對于上面爬行動物的例子，后續(xù)的增量大多還是鱷魚的話，那和過去就是重疊的，重疊的對于逼近本質(zhì)幫助就很小，幫助很小智能就不會提升，自然也就沒有智能飛輪。（老給鱷魚會導致導致不像鱷魚就不是爬行動物這類結果）

算法不解決這個問題。

有新算法更可能是放大輪子的大小或者構造，對飛不飛的起來幫助不大。對構建出更好的應用幫助倒是很大。

那到那里能找到這種對逼近本質(zhì)和元真有幫助的多樣化的數(shù)據(jù)呢？

現(xiàn)在看只有兩種方法：一種方法是加大采集范圍和力度，也就是說等著真實世界生產(chǎn)，但拿的更全；一種則是自生成。讓人工智能生成的數(shù)據(jù)可以輔助人工智能的進化。前者對應多模態(tài)，后者則首先是領域本身的特質(zhì)。

三、多模態(tài)解決問題么？

2010年前后開始的人工智能浪潮是從多模態(tài)開始的，雖然不同創(chuàng)業(yè)者往往從不同的維度開始，但最大的兩個分支：視覺和語音依賴的正是聲光電熱力磁幾個關鍵感知維度中的聲和光。需要補充一點的是：聲不單是常見的識別還包括聲紋、噪聲檢測、故障檢測等，光也不單包括人臉識別還可以用紅外線來檢查物品質(zhì)量、問題，深度攝像頭來做三維場景的感知等。

傳感器的低成本和精度提升是多模態(tài)的基礎。

多模態(tài)肯定能解決數(shù)據(jù)上量的問題，質(zhì)的問題則不太行。

量上只要一定量的攝像頭就可以每天獲取大量信息。

但質(zhì)上面因為你部署多少維度的傳感器就有多少維度的信息，真要獲取這些信息，純粹依賴自己就需要慢慢部署累積，依賴合作則更困難因為數(shù)據(jù)交易流轉(zhuǎn)本身困難重重，所有權、使用權并不清楚。所以多模態(tài)在長時間軸上能幫助緩慢解決問題，但注定需要非常大的成本和時間，沒可能輔助啟動智能飛輪。

這很像一個大排氣量的汽車配了個小的供油管，怎么使勁給油也是不夠。

四、數(shù)據(jù)能夠自生成么？

數(shù)據(jù)自生成有個悖論。

如果元真和本質(zhì)配合著全量的規(guī)則，做數(shù)據(jù)的生成，那對本質(zhì)的表達是充分的，這樣你生成的數(shù)據(jù)是多樣且有意義的，肯定有助于智能飛輪。但如果規(guī)則是局部的，那就會生成大量重復數(shù)據(jù)，這些數(shù)據(jù)都在原來的范疇里面等于垃圾數(shù)據(jù)。從他們也只會回到部分規(guī)則和本質(zhì)。

這時候問題的關鍵變成到那里尋找一種隨機性，并且這種隨機性的結果，在領域或特定的范圍里是真實的。你創(chuàng)造了一些爬行動物的數(shù)據(jù)，那得和蛇或者其它的什么一樣，恐龍都行，否則就構成對爬行動物這個概念的污染。

從這個角度看大模型的幻覺是有益的，它提供了原始的可能。但這類幻覺有助于構建一個虛擬的世界，對現(xiàn)實問題則不行。如果任由它幻覺下去倒是可能有個智能飛輪，但沒人知道它會飛到那里去了。

尋找智能飛輪：從數(shù)據(jù)枯竭到多模態(tài)再到自生成

（這個幻覺缺點在數(shù)據(jù)生成場合可能并不是真的缺點）

https://www.arxiv-vanity.com/papers/2306.08302/

五、那AlphaGo為什么行？

因為AlphaGo正好規(guī)則是清晰的，只要符合圍棋規(guī)則的任何嘗試都是真實的一部分。這時候“幻覺”反倒是有助于窮盡可能性。

從這里我們可以總結出數(shù)據(jù)自生成的關鍵：“幻覺”+規(guī)則。為了達成目標，最終當然還有目標上的反饋，比如成敗?；糜X加規(guī)則能夠進行快速的產(chǎn)出，在結果上能夠快速反饋，這對于數(shù)據(jù)生成會非常關鍵。

六、下個AlphaGo在那兒？

那還有什么領域符合這種特征，能夠像AlphaGo一樣啟動智能飛輪么？

從前面的描述我們可以發(fā)現(xiàn)，這種領域的特征是前置的，反倒是和算法、數(shù)據(jù)現(xiàn)狀關聯(lián)不大。

符合這種特征就意味著更可能快速煉出九轉(zhuǎn)金丹。

游戲之外我馬上能想到的是編程。

編譯器等確保了編程的規(guī)則足夠清楚，差一點都不行。

在很多場景下可以用測試驅(qū)動開發(fā)的方法定義最終結果對不對。

過往數(shù)據(jù)量也足夠點燃第一把火。性能、穩(wěn)定性等非功能性指標也都可以很量化的進行度量。

編程的難處在于新領域來的時候，要能把這種需求模糊性描述成一種可度量的數(shù)字型的目標。這樣軟件的產(chǎn)品就會變成變成對錯清楚的一種系統(tǒng)，在這種情況下內(nèi)部的各種構建可以讓模型完成。

如果這是真的，那么程序員這個行業(yè)一定會面臨巨大變化。

不是說消滅這個職業(yè)，而是說工作的內(nèi)涵會和過往很不一樣。

醫(yī)療是什么情況，雖然琢磨事這個號的讀者很多會關注這個領域，但很不幸醫(yī)療不是有智能飛輪的領域，需要的是靠算法等進步一點點的推著往前走。（不是說AI對它沒幫助，沒機會，沃森類系統(tǒng)一定會出來）

因為病本身就不怎么清楚，“幻覺”和規(guī)則也就沒法產(chǎn)生有效數(shù)據(jù)，如果基于這樣的模擬數(shù)據(jù)來做模型，然后去指導給真人看病，再在反饋中修正，這怎么想也不靠譜。反饋代價也太高，沒準人類都死光了還不夠它驗證幻覺的。

企業(yè)運營管理是什么情形？這反倒是部分可以。

這好像有點矛盾，理論上醫(yī)院也是一種企業(yè)，為什么醫(yī)院不行，企業(yè)就行?

因為企業(yè)內(nèi)在差別很大，既有封閉系統(tǒng)，又有開放復雜系統(tǒng)。

企業(yè)里的場景和任務，其實是在封閉和開放之間連續(xù)的，比如總是既有外賣小哥這類工作，也有CEO的工作，前者就封閉后者就開放。然后不同的企業(yè)里不同類型的工作配比不一樣，比如工廠里或者清潔公司就封閉度高，大學可能就開放度高。

這種配比決定組織的性質(zhì)。

這就導致在很多貼近封閉場景的場合其實可以找到最優(yōu)解，關鍵是邊界要切清楚。切到極端其實和圍棋是一樣的，比如即使不用大模型物流怎么配送最優(yōu)也可以用算法求解（求解器），因為它邊界清晰。

最后想說的是反身性明顯的領域，會比較困難，比如股票交易。理論上講股票和游戲很像，數(shù)據(jù)非常充分，數(shù)據(jù)的獲取也不困難，幻覺于規(guī)則對應的結果馬上也有反饋。但股票市場的反身性太明顯，這導致它近乎沒有規(guī)則。這種情況下，AlphaGo這個意義上的智能飛輪轉(zhuǎn)起來也沒用，需要另外的視角和方法。

七、小結

結論是智能飛輪存在與否是個領域特質(zhì)，和算力、算法關聯(lián)不大。領域不對，就沒數(shù)據(jù)飛輪，沒數(shù)據(jù)飛輪的時候適合打呆仗，結合多模態(tài)逐步累積。

這也就意味著在我們XX說的系統(tǒng)型超級應用對應的長尾曲線里面有智能飛輪效應的會跑在前面。對于純粹大模型的研發(fā)者，它們負責引領；對于系統(tǒng)型超級應用的開發(fā)方核心是尋找到有智能飛輪的領域并據(jù)此調(diào)配策略；對于長尾曲線上的應用，更適合的是快速產(chǎn)出體驗。AI未來的格局倒是越來越清楚了。

專欄作家

琢磨事，微信公眾號：琢磨事，人人都是產(chǎn)品經(jīng)理專欄作家。聲智科技副總裁。著有《終極復制：人工智能將如何推動社會巨變》、《完美軟件開發(fā)：方法與邏輯》、《互聯(lián)網(wǎng)+時代的7個引爆點》等書。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可，禁止轉(zhuǎn)載。

題圖來自 Unsplash，基于 CC0 協(xié)議

該文觀點僅代表作者本人，人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務。

更多精彩內(nèi)容，請關注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App