99riAV国产精品无码,国产激情久久久久老熟女亚洲,亚洲精品无码av老牛影视网址

搜索

APP

起點(diǎn)課堂會員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會特權(quán)

個人IP打造特權(quán)

30+門專項技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導(dǎo)直播

12場專業(yè)技能直播

會員專屬社群

榮耀標(biāo)識

開通會員

發(fā)布

注冊 | 登錄

產(chǎn)品經(jīng)理的AI基礎(chǔ)：淺談大模型的局限性（上）

wanee

2024-09-10

0 評論 720 瀏覽 0 收藏

本文深入探討了這些挑戰(zhàn)，并提出了實(shí)際的策略和考慮因素，幫助產(chǎn)品經(jīng)理在設(shè)計和優(yōu)化AI產(chǎn)品時做出明智的決策。通過案例分析和技術(shù)策略，我們探索如何在保障性能的同時控制成本，以及如何避免或最小化AI模型中的“幻覺”問題。

在大模型產(chǎn)品化的過程中，AI產(chǎn)品經(jīng)理需要探索大模型的邊界。其中包含大模型本身無法被解決的能力邊界、工程化過程中的限制、以及將來隨著模型迭代逐漸可能被解決的問題。

本文將先探討第一部分，關(guān)于大模型可能存在的無法解決的問題。

大模型雖然在處理復(fù)雜任務(wù)時表現(xiàn)出色，但它們的能力并非無限。例如，大模型可能在理解因果關(guān)系、進(jìn)行邏輯推理或者處理特定類型的數(shù)據(jù)時存在局限。這些限制可能源于模型的訓(xùn)練數(shù)據(jù)、算法設(shè)計或者計算資源的限制。

一、成本和性能的平衡，性價比是長期話題

在AI大模型產(chǎn)品化過程中，平衡成本、性能和響應(yīng)速度是至關(guān)重要的。想要追求性能越強(qiáng)的大模型，就越需要越高的計算成本。性能越好的大模型，需要的計算金錢成本越高，同時計算成本越高，響應(yīng)速度會隨之下降。

如何定义B端产品及B端产品经理方法论

相较于C端产品，B端产品最大的特点是：面向特定领域用户，且数量少得多，但更注重对用户专业领域操作流程的深度挖掘——也就是专业性更强，与业务的结合更紧密。

查看详情 >

例如，百度文庫是國內(nèi)早期接入生成式AI能力，并將其應(yīng)用到全流程內(nèi)容創(chuàng)作的AI產(chǎn)品。通過智能貫穿從搜集材料到制造亮點(diǎn)等多個創(chuàng)作場景，百度文庫AI新功能上線至今，累計AI用戶數(shù)已超1.4億，累計AI新功能使用次數(shù)超15億。在平衡成本、性能和響應(yīng)速度方面，百度文庫通過優(yōu)化算法和模型結(jié)構(gòu)，提高了模型的運(yùn)行效率，降低了對計算資源的需求。這使得百度文庫能夠在保持高性能的同時，有效控制成本，并提供快速響應(yīng)的服務(wù)。此外，百度文庫還通過持續(xù)的功能迭代和優(yōu)化，不斷提升用戶體驗，滿足不同用戶群體的需求。

再例如，蘋果公司在AI大模型產(chǎn)品化過程中的設(shè)計（Apple Intelligence 的架構(gòu)圖，其中在端上有兩個模型，而在云端還有一個基于隱私云計算的大模型）選擇反映了其對性能、成本和響應(yīng)速度的綜合考量。蘋果的策略主要集中在以下幾個方面：

1. 端側(cè)模型的優(yōu)化

蘋果開發(fā)了約30億參數(shù)的端側(cè)模型，這些模型在設(shè)備上運(yùn)行，能夠處理針對性任務(wù)，同時保持較高的測試得分，甚至優(yōu)于一些參數(shù)量更大的開源模型。這種設(shè)計有助于保護(hù)用戶隱私，因為數(shù)據(jù)在本地處理，不上傳到云端，同時也減少了對網(wǎng)絡(luò)的依賴，提高了響應(yīng)速度。

2. 云端模型的輔助

除了端側(cè)模型，蘋果還構(gòu)建了基于蘋果芯片服務(wù)器的云端模型，以處理更復(fù)雜的任務(wù)。這種云端模型可以提供更強(qiáng)大的計算能力，但蘋果通過私有云計算和端到端加密技術(shù)來確保數(shù)據(jù)處理的安全性。

3. 性能與成本的平衡

蘋果通過技術(shù)創(chuàng)新，如模型壓縮和優(yōu)化算法，來控制模型的大小和計算需求，從而在不犧牲性能的前提下降低成本。這種方法允許蘋果在保持設(shè)備續(xù)航和效率的同時，提供強(qiáng)大的AI功能。

4. 用戶體驗的重視

蘋果的產(chǎn)品設(shè)計始終以用戶體驗為中心。在AI大模型的應(yīng)用上，蘋果注重將AI功能無縫集成到其操作系統(tǒng)中，使用戶無需深入了解底層技術(shù)即可享受AI帶來的便利。

5. 合作伙伴的引入

蘋果也與OpenAI等第三方合作，將ChatGPT等大模型集成到蘋果的生態(tài)系統(tǒng)中，為用戶提供更多樣化的AI服務(wù)。這種合作模式既補(bǔ)充了蘋果自身的技術(shù)能力，也為用戶提供了更多的選擇。

6. 隱私保護(hù)的強(qiáng)調(diào)

在所有AI功能的設(shè)計中，蘋果都強(qiáng)調(diào)隱私保護(hù)的重要性。無論是端側(cè)模型還是云端模型，蘋果都采取了嚴(yán)格的數(shù)據(jù)保護(hù)措施，確保用戶數(shù)據(jù)的安全和私密性。

通過這些策略，蘋果能夠在保持高性能的同時，有效控制成本，并提供快速響應(yīng)的服務(wù)，從而在AI大模型的產(chǎn)品化過程中實(shí)現(xiàn)最佳性價比。

二、上下文窗口大小和模型不穩(wěn)定性問題

1. 什么是上下文窗口大小

上下文窗口大小指的是AI大模型在一次交互中能夠處理的最大字符數(shù)或令牌數(shù)。這就像一個人在對話中能夠記住的信息量，如果信息量過大，就像人會忘記之前的對話內(nèi)容一樣，AI 也可能忘記或混淆信息。

2. 什么是不穩(wěn)定性

不穩(wěn)定性指的是我們平時所說的“幻覺”問題，當(dāng)AI模型在處理信息時，可能會出現(xiàn)“幻覺”，即生成與之前對話不相關(guān)或完全錯誤的內(nèi)容。這通常發(fā)生在模型無法有效處理或記住所有相關(guān)信息時。

3. 為什么上下文窗口與不穩(wěn)定性是一個長期問題

互斥性：根據(jù)英偉達(dá)的研究，上下文窗口的大小和模型的穩(wěn)定性在很大程度上是互斥的，即增加窗口大小可能會降低模型的穩(wěn)定性。
業(yè)務(wù)場景差異：不同的業(yè)務(wù)場景對上下文窗口的需求不同，因此模型的表現(xiàn)也會有所不同。產(chǎn)品經(jīng)理需要根據(jù)具體場景調(diào)整模型的使用。
技術(shù)挑戰(zhàn)：目前還沒有模型能夠在保持巨大窗口的同時解決幻覺問題，這是一個長期存在的技術(shù)挑戰(zhàn)。

三、在這類可能無法被解決的問題中，產(chǎn)品經(jīng)理能做什么

1. 如何平衡成本和性能

產(chǎn)品經(jīng)理需要收集和分析用戶如何與產(chǎn)品交互，他們提出了哪些問題，以及他們期望得到什么樣的答案，根據(jù)問題的復(fù)雜性、對隱私的需求、對響應(yīng)速度和準(zhǔn)確性的要求，產(chǎn)品經(jīng)理需要對這些問題進(jìn)行分類。例如，一些簡單、私密性要求不高的問題可能適合用小模型處理，而復(fù)雜、需要高度準(zhǔn)確性的問題則可能需要大模型。

此外，產(chǎn)品經(jīng)理需要與研發(fā)團(tuán)隊合作，設(shè)計基準(zhǔn)測試來確定何時使用小模型、何時使用大模型。這可能涉及到性能測試、成本效益分析和用戶體驗評估。

產(chǎn)品推出后，產(chǎn)品經(jīng)理需要持續(xù)收集用戶反饋和使用數(shù)據(jù)，以便不斷優(yōu)化模型的性能和用戶體驗。這可能包括調(diào)整模型的大小、改進(jìn)算法或更新數(shù)據(jù)集。哪些可以在本地解決哪些需要聯(lián)網(wǎng)解決，這是產(chǎn)品經(jīng)理值得思考的問題。

那么，有什么在保證AI大模型性能的同時，有效控制成本，并提供快速響應(yīng)，實(shí)現(xiàn)最佳的性價比的策略呢？

模型優(yōu)化：通過模型剪枝、量化和知識蒸餾等技術(shù)減少模型大小和計算需求，從而降低成本并提高響應(yīng)速度。例如，剪枝可以移除不重要的連接或神經(jīng)元，量化可以將模型參數(shù)轉(zhuǎn)換為低精度整數(shù)，而知識蒸餾則通過讓大模型指導(dǎo)小模型學(xué)習(xí)來實(shí)現(xiàn)知識的傳遞和壓縮。
分布式訓(xùn)練與并行計算：利用多臺計算設(shè)備的算力資源，加速模型的訓(xùn)練過程。通過將訓(xùn)練數(shù)據(jù)分割成多個小塊，在不同的計算節(jié)點(diǎn)上進(jìn)行訓(xùn)練，并定時進(jìn)行參數(shù)同步和梯度更新，可以顯著提高訓(xùn)練效率。
云計算與邊緣計算的協(xié)同應(yīng)用：云計算平臺提供了強(qiáng)大的計算能力和豐富的數(shù)據(jù)存儲資源，而邊緣計算則能夠?qū)⒂嬎闳蝿?wù)下沉到終端設(shè)備或網(wǎng)絡(luò)邊緣節(jié)點(diǎn)上執(zhí)行，減少數(shù)據(jù)傳輸延遲和帶寬消耗。通過合理規(guī)劃和調(diào)度這兩種計算資源的使用，可以實(shí)現(xiàn)計算資源的優(yōu)化配置和高效利用。
硬件選擇：選擇合適的硬件架構(gòu)，如利用GPU集群或TPU來加速訓(xùn)練過程，可以顯著提高性能同時減少訓(xùn)練時間。同時，考慮使用成本效益更高的硬件，如某些情況下CPU可能比GPU更經(jīng)濟(jì)高效。
模型緩存：使用模型緩存減少模型編譯時間，這可以顯著減少程序啟動時的延遲。例如，OpenVINO?工具套件提供了模型緩存功能，它可以在編譯模型網(wǎng)絡(luò)之后，自動導(dǎo)出已編譯好的模型，加快推理程序啟動的響應(yīng)速度。
成本計算：了解模型的算力成本，包括預(yù)訓(xùn)練成本和推理成本，可以幫助做出更明智的決策。預(yù)訓(xùn)練成本與模型參數(shù)量和訓(xùn)練數(shù)據(jù)的token量成正比，而推理成本則與模型參數(shù)量和每次推理的token消耗量有關(guān)。
選擇合適的模型：不是所有場景都需要最大的模型。根據(jù)應(yīng)用需求選擇合適規(guī)模的模型，可以在滿足性能要求的同時，有效控制成本。
性能監(jiān)控與優(yōu)化：持續(xù)監(jiān)控模型的性能，及時優(yōu)化算法和硬件資源配置，以確保成本效率和響應(yīng)速度。

2. 如何盡可能避免幻覺

文本分段：產(chǎn)品經(jīng)理可以研究如何將長文本合理分段，以便AI模型能夠更有效地處理信息，同時保持對話的連貫性。
外掛記憶庫：考慮為AI模型外掛記憶庫，比如數(shù)據(jù)庫或知識圖譜，以便存儲和檢索長期記憶，增強(qiáng)模型的記憶力。
選擇適合的方法：根據(jù)業(yè)務(wù)場景選擇合適的長期記憶保持方法。例如，可以參考《多輪對話中讓AI保持長期記憶的8種優(yōu)化方式》中提到的方法。

產(chǎn)品經(jīng)理在AI大模型的產(chǎn)品化過程中，需要與技術(shù)團(tuán)隊緊密合作，通過用戶研究、場景分析和技術(shù)創(chuàng)新，來解決上下文窗口大小和模型不穩(wěn)定性的問題。這可能包括選擇合適的模型、設(shè)計有效的用戶交互流程、以及利用外掛記憶庫等策略，以提供更好的用戶體驗。同時，產(chǎn)品經(jīng)理也需要關(guān)注技術(shù)發(fā)展的最新動態(tài)，以便及時調(diào)整產(chǎn)品策略。

本文由 @wanee 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理，未經(jīng)許可，禁止轉(zhuǎn)載

題圖來自Unsplash，基于 CC0 協(xié)議

該文觀點(diǎn)僅代表作者本人，人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。

更多精彩內(nèi)容，請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App