大模型再發(fā)展5年,搜索引擎還在么?
搜索引擎自誕生到現(xiàn)在已經(jīng)經(jīng)歷了很長一段時間,那么大模型的出現(xiàn),會對搜索引擎帶來哪些影響?大模型再發(fā)展5-10年,搜索引擎是否還會存在?不妨來看看作者的分析。
大模型既是內(nèi)容的生成器也是信息的過濾器,而搜索只是信息的過濾器,那發(fā)展下去搜索引擎這個自互聯(lián)網(wǎng)發(fā)生以來就存在的產(chǎn)品會受到什么影響?
一、被動搖的搜索根基
想象一個中期場景:假如一半以上的內(nèi)容是人工智能體在生產(chǎn)和消費,那搜索引擎會怎么樣?
原始意義的搜索引擎會消失,名實具亡。
因為搜索最基礎(chǔ)的機制會被動搖,并逐漸失效。
搜索引擎從產(chǎn)品上看并不復(fù)雜,就是要在海量信息中快速找到你需要信息的工具。而判斷是不是你需要的信息就在于PageRank等算法,這些算法依賴鏈接數(shù)和質(zhì)量等判斷內(nèi)容的權(quán)重,再依賴關(guān)鍵字來判斷匹配度。
現(xiàn)在這兩點正好都會出問題。
鏈接可能不是真的鏈接,而關(guān)鍵字對應(yīng)的內(nèi)容可能是人工智能生成的內(nèi)容。人工智能生成的內(nèi)容增長速度一定遠大于人生成的內(nèi)容,而這部分內(nèi)容并沒譜,是帶著我們經(jīng)常說的幻覺所生成的內(nèi)容。
假如互聯(lián)網(wǎng)上的內(nèi)容一共是十,如果這部分內(nèi)容的比例超過五,那搜索要面對的就是概率在50%以上的一個虛擬世界反饋出的結(jié)果。不管你怎么用算法來排序,也規(guī)避不了這種失真和不準的問題。
可以想象一個極端情況,就是全網(wǎng)50%的內(nèi)容都和一個人工智能生成的內(nèi)容發(fā)生鏈接,那按照搜索的機制,無疑的這是應(yīng)該被排到前面的,而則可能是不對的,它不一定質(zhì)量很好,而只可能是被用其它模型生成內(nèi)容用的多。
這進一步意味著信息精度的責(zé)任方在轉(zhuǎn)移,過去是搜索引擎負責(zé)從已有內(nèi)容中盡可能過濾出有價值的信息,而如果這套機制失靈,那就變成大模型在信息生成的同時需要扮演信息質(zhì)量保證者的角色。模型自身決定了信息的精度。
二、不局限于搜索引擎
這顯然不局限于搜索引擎,過去我們一共有兩種主要信息集散方法:
一種就是上面說的搜索引擎,一種則是在頭條和抖音上廣泛被應(yīng)用的個性化推薦。
而如果大模型在內(nèi)容源上占據(jù)統(tǒng)治性,超過50%,那依賴于個性化推薦的產(chǎn)品同樣會受到?jīng)_擊。不過沖擊的表現(xiàn)形式會有所不同。
國內(nèi)幾個個性化推薦平臺,通常和UGC相關(guān),這樣一來,首先沖擊的是內(nèi)容生成端。
如果把大模型的內(nèi)容生產(chǎn)水平畫一條線,那這條線以下的生產(chǎn)能力,沒有存在的基礎(chǔ),會很快的被淹沒。而在這條線上面的除非有明確的標識度,比如你在社會上是個名人,否則也會被淹沒。
而如果是大模型對大模型(都基于大模型進行生產(chǎn)),那數(shù)據(jù)量則會飛漲。
內(nèi)容膨脹之后,很可能流量分布上會兩個趨勢同時發(fā)生:一個是中心節(jié)點會有更大的增長量,一個則是一般的流量會被攤的更加稀薄,也就是上面說的一般人會更容易被淹沒。
像更加靠譜的中心節(jié)點集中是因為不知道別的信息是對是錯,只能借助于傳統(tǒng)的社會體系的篩選,一般的流量更加分散則是因為內(nèi)容過多,流量還是那么多,內(nèi)容變多,那平均下來肯定更加稀薄。
這就會產(chǎn)生一個流量的鴻溝。
跨越流量鴻溝可能比現(xiàn)在更為困難,而在此之前拿到的流量可能會變的更加值錢。
與此同時,另一個附帶效果可能是UGC平臺利潤空間會下降,因為信息的總價值并不會因為因為量的增加而增加,但它的處理成本卻會因此而上升。信息量增加后,不管存儲還是計算成本都會增加。
三、怎么辦?
怎么辦里面最原點的選擇是不用(比如禁止大模型使用),但這顯然不靠譜。
不同的學(xué)校對此也采取過不同的態(tài)度,有的學(xué)校是完全禁絕大模型在做作業(yè)等環(huán)節(jié)的應(yīng)用;有的學(xué)校則非常開放,全面接受。
但這事其實不難選擇,因為我們好像又回到了大禹和他爹的選擇
未來的現(xiàn)實是大模型會成為工作生活的底座和外殼,在它之上每個人都會變成現(xiàn)實版的鋼鐵俠。
你可以選擇不穿,那你力量就弱。既然如此,那顯然不能禁止,只能比誰用的更好。
關(guān)鍵是要在面對的同時處理它潛在的負向結(jié)果。
最典型辦法就是唯一性身份認證。唯一性身份認證能夠降低一部分純粹機器人的內(nèi)容生產(chǎn),但沒辦法避免每個內(nèi)容生產(chǎn)者都變成超級英雄一樣超高速進行內(nèi)容生產(chǎn)。
次一級的方法則是模型對模型。我們確實需要清楚的認識到因為信息的暴漲,最終只有模型才可能處理模型相關(guān)的事務(wù)。但即使把模型滲透到審核等環(huán)節(jié),模型對模型也只能降低的太差的水貨,或者說明顯在認知錯誤。模型生產(chǎn)出來的真的質(zhì)量上乘的作品是沒辦法的,也不應(yīng)該被禁止。但不管結(jié)果如何,模型要肩負起信息生成和分發(fā)的責(zé)任是確定的。
從這個角度再遞進一步,到每個人具體的生活體驗,也會發(fā)生變化。因為信息的膨脹個人已經(jīng)失去了自我篩選信息的能力(看報紙的時候基本是自我進行信息篩選),所以這時候助理會履行這個職責(zé),別看過去的小愛同學(xué)等又呆又傻,但到后面它還是會變得越來越不可或缺。助理首先沖擊搜索,相當于在搜索上又套了個殼,推薦由于本質(zhì)上相當于是助理在后臺進行推送,影響還在搜索之后,比如個人助理怎么和推薦進行交互一樣是需要解決的問題。
但影響還不止于此。
四、奇點曲線的新解
全面擁抱大模型等馬上就帶來一個新的后果。
我們都知道當年奇點臨近里畫了一條指數(shù)曲線,但這條曲線的含義卻很少被進一步解讀。
當社會的變化和智能是指數(shù)型向上的時候,比如GDP增長,那意味著企業(yè)或者個人的事業(yè)必須是指數(shù)向上,否則就會被甩下來。道理很簡單,如果平均GDP增長是10%,一個企業(yè)的增長則是5%,那大概率它會破產(chǎn),而一個人的收入增長如果是5%,那很可能他會變的相對貧困。
而人的部分是不可能做出指數(shù)型增長的,所以能夠匹配高速增長且不掉落,就只可能是基于大模型等技術(shù)的組織和個人。這是一種碳基智能和硅基智能找到合適邊界的復(fù)合體。從這個角度看大模型確實也只能被擁抱,而不可能被規(guī)避。
回到我們文章題目的設(shè)問,從這個角度看,現(xiàn)在形態(tài)的搜索可能五年到十年后就真的不在了。因為當下搜索這種信息分發(fā)方式太不智能了,智能越翻倍,這種初級的信息分發(fā)方式就顯的越落后和不精準。
五、小結(jié)
在《尋找智能飛輪:從數(shù)據(jù)枯竭到多模態(tài)再到自生成》里,我們提到過這樣一個觀點:企業(yè)里的場景和任務(wù),其實是在封閉和開放之間連續(xù)的,比如總是既有外賣小哥這類工作,也有CEO的工作,前者就封閉后者就開放。然后不同的企業(yè)里不同類型的工作配比不一樣,比如工廠里或者清潔公司就封閉度高,大學(xué)可能就開放度高。如果面向未來的話,那顯然要加一點,硅基的人工智能和碳基的人類所對應(yīng)的整體智能配比也不同,這會變成未來組織的一個關(guān)鍵特征。
參考:
- 名實唯一性:數(shù)字與AI經(jīng)濟里的那些潛規(guī)則
- AI Agent:大模型與場景間的價值之橋,但不適合當純技術(shù)看
- 創(chuàng)業(yè)者的窘境:從人力資本到四維實體,有點哲學(xué)…
- 未來十年最確定的事
- 給世界求個解:OpenAI的Sam Altman為什么干世界幣?
專欄作家
琢磨事,微信公眾號:琢磨事,人人都是產(chǎn)品經(jīng)理專欄作家。聲智科技副總裁。著有《終極復(fù)制:人工智能將如何推動社會巨變》、《完美軟件開發(fā):方法與邏輯》、《互聯(lián)網(wǎng)+時代的7個引爆點》等書。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于 CC0 協(xié)議
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
- 目前還沒評論,等你發(fā)揮!