人工智能的原理是什么?

0 評論 2663 瀏覽 13 收藏 17 分鐘
🔗 产品经理的核心价值是能够准确发现和满足用户需求,把用户需求转化为产品功能,并协调资源推动落地,创造商业价值

本文全面介紹了人工智能(AI)的工作原理,包括其定義、組成部分以及如何逐步構(gòu)建和運(yùn)用AI系統(tǒng)。文章從數(shù)據(jù)收集、預(yù)處理、模型選擇、訓(xùn)練、測試評估、優(yōu)化、部署到持續(xù)學(xué)習(xí)等各個(gè)環(huán)節(jié),詳細(xì)闡述了AI的工作流程,旨在幫助讀者更好地理解AI技術(shù)及其應(yīng)用,希望對你有所幫助。

人工智能 (AI) 是一項(xiàng)不斷發(fā)展的技術(shù),旨在模仿人類智能。它幫助計(jì)算機(jī)學(xué)習(xí)如何像人腦一樣推理、學(xué)習(xí)和解決問題。

從醫(yī)療保健到金融等行業(yè)正在實(shí)施人工智能技術(shù),對我們的生活產(chǎn)生有意義的積極影響。人工智能在自動(dòng)駕駛汽車和個(gè)人助理等領(lǐng)域具有進(jìn)步的潛力,可能會(huì)推動(dòng)科學(xué)突破,增強(qiáng)醫(yī)療掃描能力,并實(shí)現(xiàn)準(zhǔn)確的面部識(shí)別。

隨著人工智能研究的加速以及人工智能的應(yīng)用在商業(yè)和個(gè)人生活中發(fā)揮越來越大的作用,了解人工智能的工作原理以及如何使用它比以往任何時(shí)候都更加重要。

本文全面概述了人工智能,包括其組件以及其工作原理的逐步介紹!

什么是人工智能?

人工智能是計(jì)算機(jī)科學(xué)的一個(gè)領(lǐng)域,試圖模擬人類的思維方式。您將數(shù)據(jù)源中的信息提供給人工智能系統(tǒng),讓人工智能處理它,并創(chuàng)建使用輸入數(shù)據(jù)作為參考的經(jīng)過訓(xùn)練的模型。

擁有的數(shù)據(jù)越多,人工智能系統(tǒng)就能學(xué)得越好。

然而,并非所有人工智能系統(tǒng)都需要大數(shù)據(jù)源。您可以使用不同的技術(shù)訓(xùn)練一些具有較小數(shù)據(jù)集的模型,例如強(qiáng)化學(xué)習(xí)(一種機(jī)器學(xué)習(xí)技術(shù),我們接下來討論)。

完成后,您可以向 AI 提出問題,讓它根據(jù)學(xué)到的知識(shí)進(jìn)行估計(jì)并采取行動(dòng)。但人工智能響應(yīng)的程度和準(zhǔn)確性主要取決于訓(xùn)練數(shù)據(jù)的質(zhì)量和算法。

您可以通過多種方式使用 AI 解決方案,包括:

  • 聊天機(jī)器人。人工智能機(jī)器人利用業(yè)務(wù)數(shù)據(jù)進(jìn)行訓(xùn)練,以便與人類聊天并使用人類語言實(shí)時(shí)回答問題。
  • 虛擬助理。Amazon Alexa、Apple Siri 和 Google Assistant 等人工智能工具在日常生活中為消費(fèi)者提供幫助。
  • 生成式人工智能。 編寫人工智能工具(例如OpenAI 的ChatGPT)、圖像工具(例如Midjourney)以及語音工具(例如ElevenLabs)可以根據(jù)輸入生成不同形式的媒體。
  • 語音識(shí)別。語音識(shí)別工具根據(jù)音頻輸入確定說話者是誰以及他們所說的內(nèi)容。
  • 搜索引擎。搜索工具通過創(chuàng)造更好的用戶體驗(yàn)并實(shí)時(shí)生成結(jié)果來改進(jìn)信息收集過程。

機(jī)器學(xué)習(xí):人工智能的基礎(chǔ)

機(jī)器學(xué)習(xí)(ML) 是人工智能系統(tǒng)學(xué)習(xí)的基礎(chǔ)。您提供給機(jī)器學(xué)習(xí)工具的數(shù)據(jù)可幫助人工智能創(chuàng)建數(shù)據(jù)集,以學(xué)習(xí)如何做出決策和預(yù)測,而無需進(jìn)行編程來執(zhí)行特定任務(wù)。

然而,雖然機(jī)器學(xué)習(xí)允許人工智能系統(tǒng)從數(shù)據(jù)中學(xué)習(xí),但它們?nèi)匀恍枰幊毯退惴▉硖幚頂?shù)據(jù)并生成有意義的見解。

機(jī)器學(xué)習(xí)的工作原理是為工具提供大量數(shù)據(jù)。然后,您可以處理該數(shù)據(jù)以創(chuàng)建可用于處理人工智能任務(wù)的數(shù)學(xué)模型。從本質(zhì)上講,它允許人工智能應(yīng)用程序像人類一樣執(zhí)行任務(wù)。

圖像分類就是一個(gè)很好的例子。假設(shè)您想訓(xùn)練人工智能識(shí)別貓。

您可以向機(jī)器學(xué)習(xí)系統(tǒng)提供貓圖像并將它們標(biāo)記為貓。然后,系統(tǒng)會(huì)從您提供的內(nèi)容中學(xué)習(xí),并在訓(xùn)練完成后識(shí)別您提供的任何貓圖片。

神經(jīng)網(wǎng)絡(luò):人工智能的構(gòu)建模塊

神經(jīng)網(wǎng)絡(luò)是一種機(jī)器學(xué)習(xí)算法,它提供了處理基于人工智能模型創(chuàng)建的信息的工具。它們由相互連接的節(jié)點(diǎn)(或人工神經(jīng)元)組成。

這些節(jié)點(diǎn)根據(jù)進(jìn)入神經(jīng)網(wǎng)絡(luò)的信息進(jìn)行調(diào)整。這使得神經(jīng)網(wǎng)絡(luò)能夠發(fā)現(xiàn)數(shù)據(jù)中的關(guān)系和模式。

節(jié)點(diǎn)分為幾層,每層都有自己的功能:

  • 輸入層接收數(shù)據(jù)。
  • 隱藏層處理數(shù)據(jù)。
  • 輸出層產(chǎn)生結(jié)果。

深度學(xué)習(xí)是一種具有多個(gè)隱藏層的神經(jīng)網(wǎng)絡(luò),因此它可以學(xué)習(xí)數(shù)據(jù)中更復(fù)雜的關(guān)系。然后,數(shù)據(jù)科學(xué)家可以使用不同的格式(文本、音頻、視頻和圖像)優(yōu)化這些層,以提高準(zhǔn)確性,但他們還需要更多的培訓(xùn)才能工作。數(shù)據(jù):人工智能的燃料

數(shù)據(jù)是人工智能系統(tǒng)的“燃料”。如果沒有大量數(shù)據(jù)集來訓(xùn)練人工智能模型,人工智能就不會(huì)具有任何功能。

好的人工智能訓(xùn)練數(shù)據(jù)具有幾個(gè)特征,包括:

  • 資料齊全,無遺漏
  • 與AI系統(tǒng)功能一致
  • 準(zhǔn)確,無錯(cuò)誤數(shù)據(jù)
  • 最新,沒有過時(shí)的信息

您使用多種類型的數(shù)據(jù)來訓(xùn)練人工智能系統(tǒng),分為三類:結(jié)構(gòu)化、非結(jié)構(gòu)化和半結(jié)構(gòu)化。

結(jié)構(gòu)化數(shù)據(jù)具有預(yù)定義的格式。想想日期、地址、信用卡號(hào)碼、數(shù)字系列和其他標(biāo)準(zhǔn)輸入方法。輸入人工智能系統(tǒng)的每條數(shù)據(jù)都會(huì)有一個(gè)標(biāo)準(zhǔn)格式。

非結(jié)構(gòu)化數(shù)據(jù)缺乏任何特定信息。輸入非結(jié)構(gòu)化文本、圖像、視頻和圖像,讓 AI 找到數(shù)據(jù)中的模式。人工智能可以使用自然語言處理(NLP)、計(jì)算機(jī)視覺和其他方法來處理信息。

如果沒有預(yù)定義的模型,您可以使用半結(jié)構(gòu)化數(shù)據(jù)。此數(shù)據(jù)使用 JSON、XML 和 CSV 等文件格式。走這條路將為您帶來非結(jié)構(gòu)化數(shù)據(jù)源的好處以及輕松存儲(chǔ)訓(xùn)練數(shù)據(jù)的能力。?

算法:人工智能的問題解決者

算法是人工智能的支柱。它們是告訴人工智能如何學(xué)習(xí)、改進(jìn)決策和解決問題的數(shù)學(xué)程序。算法將原始數(shù)據(jù)轉(zhuǎn)化為您每天可以使用的見解。

人工智能程序中使用的流行算法包括:

  • 線性回歸。根據(jù)輸入和輸出的數(shù)學(xué)關(guān)系進(jìn)行預(yù)測。
  • 決策樹?;跀?shù)據(jù)屬性的模型決策。
  • K-均值聚類。創(chuàng)建數(shù)據(jù)集群并找到每個(gè)集群的中心以根據(jù)輸入識(shí)別模式。

這些算法的工作原理是獲取您輸入的數(shù)據(jù)并將其輸入到算法中。您提供的高質(zhì)量數(shù)據(jù)越多,算法就越容易找到模式并將其轉(zhuǎn)化為可行的見解!

人工智能如何逐步運(yùn)作

既然您了解了人工智能是什么,您可能想知道如何在實(shí)踐中使用它。本節(jié)將引導(dǎo)您逐步完成構(gòu)建人工智能系統(tǒng)的過程。

  • ?人工智能流程:
  • 數(shù)據(jù)采集
  • 數(shù)據(jù)預(yù)處理
  • 選型
  • 訓(xùn)練模型
  • 測試與評估
  • 模型優(yōu)化
  • 部署
  • 持續(xù)學(xué)習(xí)

1. 數(shù)據(jù)收集

數(shù)據(jù)收集是開發(fā)人工智能系統(tǒng)最關(guān)鍵的部分之一。這是收集大量數(shù)據(jù)來訓(xùn)練人工智能系統(tǒng)的過程。

您的訓(xùn)練數(shù)據(jù)可以是任何格式:文本、數(shù)字、圖像、視頻或音頻。數(shù)據(jù)的格式取決于您使用的是結(jié)構(gòu)化數(shù)據(jù)集還是非結(jié)構(gòu)化數(shù)據(jù)集。

讓我們以查看社交媒體帖子對品牌的情緒為例。從社交媒體收集大量數(shù)據(jù)集并對這些帖子的情緒進(jìn)行分類。它們是積極的、消極的還是中性的?

將這些結(jié)果放入 CSV 文件中以進(jìn)行訓(xùn)練。完成后,您可以確定您的品牌在網(wǎng)上的情感。

2. 數(shù)據(jù)預(yù)處理

您不應(yīng)該只輸入找到的數(shù)據(jù)。人工智能系統(tǒng)需要準(zhǔn)確、最新且相關(guān)的信息才能獲得最佳結(jié)果。如果不預(yù)處理數(shù)據(jù),就無法保證這種情況會(huì)發(fā)生,尤其是當(dāng)您擁有大量數(shù)據(jù)時(shí)。

噪聲去除(也稱為數(shù)據(jù)平滑)是一項(xiàng)重要過程。這意味著查找并刪除任何損害學(xué)習(xí)過程的數(shù)據(jù)并修復(fù)任何結(jié)構(gòu)化數(shù)據(jù)的格式。

以正在接受財(cái)務(wù)分析訓(xùn)練的人工智能模型為例。查看您的訓(xùn)練數(shù)據(jù)(例如股票價(jià)格和利率),以查找任何格式不正確的值。包含或刪除美元符號(hào),確保小數(shù)位于正確的位置,并刪除任何其他異常情況。

3、模型選擇

模型選擇是人工智能開發(fā)過程中的一個(gè)步驟,您可以在其中選擇最適合當(dāng)前問題的人工智能模型。許多人工智能模型都可用,包括機(jī)器學(xué)習(xí)算法、深度神經(jīng)網(wǎng)絡(luò)或使用各種技術(shù)的混合模型。

除了不同類型的人工智能算法之外,還可以使用多種類型的機(jī)器學(xué)習(xí):

監(jiān)督學(xué)習(xí)。依靠人工標(biāo)記的數(shù)據(jù)來學(xué)習(xí)和獲取知識(shí)。

無監(jiān)督學(xué)習(xí)。依靠未標(biāo)記的數(shù)據(jù)和學(xué)習(xí)模式來獲取知識(shí)。

強(qiáng)化學(xué)習(xí)。依靠人工智能與環(huán)境的交互來從錯(cuò)誤中學(xué)習(xí)并獲取知識(shí)。

深度學(xué)習(xí)模型可以通過多層轉(zhuǎn)換數(shù)據(jù)。它適合更復(fù)雜的任務(wù)。

您選擇的模型將取決于幾個(gè)因素,包括:

  • 您擁有的數(shù)據(jù)量
  • 等待訓(xùn)練的時(shí)間
  • 您的總資源
  • 您擁有的數(shù)據(jù)類型
  • 您的總預(yù)算

4. 訓(xùn)練模型

當(dāng)您預(yù)處理數(shù)據(jù)并選擇模型時(shí),就進(jìn)入了訓(xùn)練階段。

在此階段中,您將把數(shù)據(jù)分為兩組:訓(xùn)練集和驗(yàn)證集。訓(xùn)練集是您用來訓(xùn)練模型的數(shù)據(jù)集,驗(yàn)證(測試)集可幫助您了解模型的訓(xùn)練情況。

您選擇的模型將開始讀取您的數(shù)據(jù)集,使用數(shù)學(xué)和計(jì)算模型來查看數(shù)據(jù)模式并創(chuàng)建輸出模型以幫助其做出未來預(yù)測。

這所需的時(shí)間取決于您擁有的訓(xùn)練數(shù)據(jù)量以及您計(jì)劃訓(xùn)練的模型有多大。層數(shù)越多,花費(fèi)的時(shí)間就越長,使用的資源也就越多。

5. 測試與評估

您不應(yīng)該僅僅指望 AI 模型在完成訓(xùn)練后就處于生產(chǎn)狀態(tài)。根據(jù)數(shù)據(jù)集的質(zhì)量以及您在預(yù)處理方面的工作表現(xiàn),最終模型可能不會(huì)給出很好的結(jié)果。

這就是您創(chuàng)建的單獨(dú)驗(yàn)證數(shù)據(jù)集可以發(fā)揮作用的地方。您的驗(yàn)證數(shù)據(jù)集包含輸入和放入 AI 應(yīng)用程序后的預(yù)期輸出。

驗(yàn)證 AI 模型時(shí),您需要進(jìn)行多次測量。準(zhǔn)確度(正確預(yù)測的百分比)、精確度(實(shí)際為正的預(yù)測的百分比)和召回率(正確識(shí)別的案例的百分比)是最常見的。

以下幾種情況可能會(huì)出現(xiàn)問題:

數(shù)據(jù)不佳。不準(zhǔn)確的數(shù)據(jù)意味著您的模型無法產(chǎn)生良好的結(jié)果。

欠擬合。AI模型過于簡單,無法捕捉數(shù)據(jù)模式。

偏見。這些數(shù)據(jù)傾向于一個(gè)方向,并且趨勢與人類的偏見相同。

6. 模型優(yōu)化

模型優(yōu)化是提高 AI 模型性能的過程。這可能意味著微調(diào)或修改模型參數(shù)并使用正則化技術(shù)。

微調(diào)意味著優(yōu)化模型的參數(shù)。您可以更改神經(jīng)網(wǎng)絡(luò)的權(quán)重或用于調(diào)整模型的 AI 算法。

調(diào)整模型的架構(gòu)意味著在神經(jīng)網(wǎng)絡(luò)中添加和刪除層,以改變層之間的連接并更好地捕獲數(shù)據(jù)的復(fù)雜性。

正則化技術(shù)有助于防止過度擬合,當(dāng)模型在經(jīng)過訓(xùn)練的數(shù)據(jù)(而不是未見的數(shù)據(jù))上表現(xiàn)良好時(shí),這非常有用。正則化使人工智能更容易泛化并提供更準(zhǔn)確的結(jié)果。

7. 部署

部署是完成 AI 模型訓(xùn)練和優(yōu)化后模型開發(fā)生命周期的最后階段。這是將模型集成到現(xiàn)有系統(tǒng)或構(gòu)建新計(jì)算機(jī)程序來使用模型的過程。

例如,假設(shè)您有一個(gè)新的人工智能模型想要用于財(cái)務(wù)預(yù)測。您擁有一家產(chǎn)品業(yè)務(wù),并希望了解未來的銷售額。

您將把模型與當(dāng)前的計(jì)算機(jī)系統(tǒng)聯(lián)系起來,以獲取銷售數(shù)據(jù)、財(cái)務(wù)和其他相關(guān)信息。作為回報(bào),該模型會(huì)生成報(bào)告,估算您未來可以預(yù)期的銷售額和收入。

8. 持續(xù)學(xué)習(xí)

人工智能模型不是一次性訓(xùn)練的東西。您必須定期根據(jù)新信息訓(xùn)練模型,以繼續(xù)看到準(zhǔn)確的輸出。

您可以通過幾種方式來做到這一點(diǎn)。首先是微調(diào)您的基礎(chǔ)模型。您可以根據(jù)初始訓(xùn)練數(shù)據(jù)生成基礎(chǔ)模型,并根據(jù)新數(shù)據(jù)微調(diào)該模型。這為您的人工智能模型提供了更新的數(shù)據(jù),以做出更準(zhǔn)確的預(yù)測。

更新人工智能模型的另一種方法是通過強(qiáng)化學(xué)習(xí)人類反饋(RLHF)。通過此過程,您將監(jiān)控人工智能系統(tǒng)的反饋并對其進(jìn)行評分。然后,系統(tǒng)會(huì)了解自己做錯(cuò)了什么,并利用該反饋在未來提供更好的結(jié)果。概括

如您所見,訓(xùn)練人工智能系統(tǒng)需要幾個(gè)步驟。

  1. 數(shù)據(jù)采集。收集供您使用的相關(guān)數(shù)據(jù),并將其傳遞給培訓(xùn)程序以告知人工智能。
  2. 數(shù)據(jù)預(yù)處理。檢查數(shù)據(jù)集以刪除錯(cuò)誤數(shù)據(jù)、修復(fù)格式并確保信息保持更新。
  3. 模型選擇。選擇最適合您需求的 AI 模型。
  4. 模型訓(xùn)練。將您的訓(xùn)練數(shù)據(jù)提供給 AI 模型進(jìn)行訓(xùn)練。
  5. 模型測試。使用測試數(shù)據(jù)集確保您的模型產(chǎn)生準(zhǔn)確的結(jié)果。
  6. 模型優(yōu)化。對模型進(jìn)行更改以改進(jìn)結(jié)果和性能。
  7. 部署。將新的人工智能模型與當(dāng)前系統(tǒng)集成。

持續(xù)學(xué)習(xí)。不斷根據(jù)新信息更新您的人工智能模型,以保持其相關(guān)性并產(chǎn)生良好的結(jié)果。

然而,這只是一個(gè)示例過程。并非所有人工智能系統(tǒng)都是相同的,因此您可能需要更改此流程以滿足您的獨(dú)特需求。

本文由人人都是產(chǎn)品經(jīng)理作者【成于念】,微信公眾號(hào):【老司機(jī)聊數(shù)據(jù)】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!
专题
14281人已学习13篇文章
数据仓库是所有产品的数据中心,公司体系下的所有产品产生的所有数据最终都流向数据仓库。本专题的文章分享了什么是数据仓库和如何搭建数据仓库。
专题
15867人已学习13篇文章
生活中,我们会看到路标、指示面板、箭头指引诸如此类的常见的导航,其实网络中也有很多导航指引。导航有什么用呢?导航设计又要遵循什么规范?本专题的文章分享了导航设计指南。
专题
16613人已学习12篇文章
本专题的文章分享了支付体系的设计指南。
专题
13928人已学习13篇文章
产品体验报告,是体验者在深入了解某个产品的商业模式、使用场景、产品功能等方面后,所作出的先有深度再到广度的图文分析报告。本专题的文章分享了不同产品的体验报告。
专题
12597人已学习12篇文章
所谓SOP,即标准作业程序,指将某一事件的标准操作步骤和要求以统一的格式描述出来,用于指导和规范日常的工作。本专题的文章分享了SOP创作指南。
专题
16952人已学习14篇文章
图标是用户页面不可缺少的元素,本专题的文章分享了图标设计指南。