gif动态图无码专区,中文国产成人精品久久一区,午夜福利亚洲精品无遮挡

搜索

APP

起點課堂會員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會特權(quán)

個人IP打造特權(quán)

30+門專項技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導(dǎo)直播

12場專業(yè)技能直播

會員專屬社群

榮耀標(biāo)識

開通會員

發(fā)布

注冊 | 登錄

大語言模型實現(xiàn)智能客服知識庫文檔數(shù)據(jù)提取功能

通信產(chǎn)品的那些事

2023-05-09

7 評論 10212 瀏覽 71 收藏

智能客服的知識庫有兩類：機(jī)器人知識庫和坐席知識庫，分別是為機(jī)器人和坐席進(jìn)行服務(wù)時，提供數(shù)據(jù)的支撐。如何通過大語言模型，讓企業(yè)的文檔可批量上傳，無需更多的整理，直接轉(zhuǎn)化為有效的QA，供座席和機(jī)器人直接調(diào)用呢？本文作者對此進(jìn)行了分析，一起來看一下吧。

上一篇提到了《大語言模型實現(xiàn)智能客服知識庫自動擴(kuò)寫功能》，這次談下知識庫文檔數(shù)據(jù)提取功能的實現(xiàn)。

一、產(chǎn)品場景和需求

我們知道智能客服的知識庫有兩類：機(jī)器人知識庫和座席知識庫。

分別是為機(jī)器人和座席進(jìn)行服務(wù)時，提供數(shù)據(jù)的支撐。

智能客服系統(tǒng)會標(biāo)配知識庫管理功能，常見的形式是樹狀結(jié)構(gòu)，提供分類管理、知識庫條目管理，并支持知識庫的批量導(dǎo)入導(dǎo)出操作。

使用中，企業(yè)需要經(jīng)常性地維護(hù)管理知識庫內(nèi)容，將企業(yè)已有知識內(nèi)容文檔上傳，但如果是將原文件上傳，則系統(tǒng)最多能支持預(yù)覽功能，使用者在操作界面只能點擊打開全文檢索。而如果是機(jī)器人知識庫，直接上傳文檔是不可用的，需要操作者手工整理文檔中的內(nèi)容為機(jī)器人標(biāo)準(zhǔn)問答對。

以上是目前絕大多數(shù)主流產(chǎn)品的使用情況。

大語言模型來了，我們提出的需求很簡單，所有企業(yè)的文檔可以批量上傳，無需更多的整理，直接可自動轉(zhuǎn)化為有效的QA，供座席和機(jī)器人直接調(diào)用。

二、知識提取實測：PDF文檔內(nèi)容提取

已有諸多產(chǎn)品使用大語言模型實現(xiàn)PDF文檔數(shù)據(jù)提取，我們先看下已實現(xiàn)的產(chǎn)品的效果。

1. ChatPDF

https://www.chatpdf.com/

界面特別干凈，上傳pdf，然后conversation。

為了測試，我扔了一份100頁的產(chǎn)品手冊進(jìn)來。

上傳速度很快，最關(guān)鍵的時，對話響應(yīng)也非常的快。

對文檔內(nèi)容的解析很準(zhǔn)確，包括一些隱藏在內(nèi)部的知識點也可以快速搜索找到。

大語言模型實現(xiàn)智能客服知識庫文檔數(shù)據(jù)提取功能

2. Pandagpt

https://www.pandagpt.io/

網(wǎng)絡(luò)問題，訪問有點慢，但是這個對話的樣式，一言難盡，沒有一個版塊不是互相遮擋的，強(qiáng)迫癥死敵。

響應(yīng)速度差一些，問題回答基本到位，相比ChatPDF，略顯啰嗦。

大語言模型實現(xiàn)智能客服知識庫文檔數(shù)據(jù)提取功能

3. typeset

https://typeset.io/

主打論文檢索的typeset，也支持pdf文檔解讀。

上傳、對話響應(yīng)都十分緩慢，對話的效果非常不OK，很多知識點無法解讀，一律回復(fù)無法找到這個問題的答案。

三、自研框架的選擇

基于OpenAIEmbeddings，官方給出了基于embeddings檢索來解決GPT無法處理長文本和最新數(shù)據(jù)的問題的實現(xiàn)方案。

參考：https://www.datalearner.com/blog/1051681543488862

也可以使用LangChain框架，參考以下內(nèi)容實現(xiàn)效果。

參考：

ChatGPT怎么建立私有知識庫？：https://www.zhihu.com/question/596838257/answer/3004754396

利用LangChain和國產(chǎn)大模型ChatGLM實現(xiàn)基于本地知識庫的自動問答：https://www.zhihu.com/zvideo/1630964532179812353

另外除了從文檔中抓取數(shù)據(jù)，從指定網(wǎng)站URL抓取數(shù)據(jù)，實現(xiàn)智能客服外部知識庫，可以借助ChatGPT寫Python代碼，PythonBeautiful Soup庫的實現(xiàn)方式很成熟。

四、智能客服產(chǎn)品設(shè)計要點

回到智能客服產(chǎn)品場景中，產(chǎn)品設(shè)計使用中要考慮的問題。

1）功能分割

建議為保持原知識庫管理系統(tǒng)的完整，可增加單獨的大語言模型知識庫，避免SaaS產(chǎn)品原來的企業(yè)使用體驗和數(shù)據(jù)庫內(nèi)容產(chǎn)生交叉影響。

2）書架式管理

模型知識庫同樣支持分類管理，方便使用者管理文檔庫，能夠快速檢索文檔名稱和內(nèi)容。

提供增刪改查，預(yù)覽、批量上傳刪除等操作。并支持以QA問答對的方式全文展示，使用者可以了解到本文檔新增的有效文檔數(shù)據(jù)有多少內(nèi)容。

3）提供測試對話工具

模型庫中可內(nèi)置對話測試工具，供使用者先行進(jìn)行知識點的維護(hù)管理。

4）知識庫編輯擴(kuò)展

提供插件、支持在線改寫編輯，重新讀取。

減少重復(fù)上傳給使用者帶來的挫敗感。

5）知識庫關(guān)聯(lián)

已測試完成的大模型知識庫，可允許使用者關(guān)聯(lián)發(fā)布到座席或者機(jī)器人知識庫中，提供對話數(shù)據(jù)的擴(kuò)展。

如果是機(jī)器人知識庫，可以在機(jī)器人模板設(shè)置關(guān)聯(lián)，允許流程中各節(jié)點選擇性調(diào)用對應(yīng)的知識庫，這樣也不會破壞原有流程的知識庫體系，增強(qiáng)了部分節(jié)點的知識庫能力。

對于交叉引用知識庫的節(jié)點，權(quán)重可以允許調(diào)節(jié)，一般默認(rèn)為機(jī)器人自身知識庫為主，大模型知識庫輔助。

6）反饋機(jī)制

文本對話機(jī)器人的訪客端點踩、座席的手工點踩，和語音機(jī)器人的手工標(biāo)記無效問答，都可以幫助反饋大模型知識庫的效果。

以數(shù)據(jù)報表方式展示，手工或自動進(jìn)行知識維護(hù)。

7）功能開關(guān)

最后，仍然是設(shè)置功能性開關(guān)，并關(guān)聯(lián)到SaaS產(chǎn)品賬戶角色權(quán)限中，可邀請一部分友好客戶星火測試，不斷迭代優(yōu)化。

當(dāng)然，以上情況，也不限于智能客服產(chǎn)品范疇，一些需要知識管理的場景中，都可以借鑒。

最后還是放出業(yè)內(nèi)大廠們已實現(xiàn)的產(chǎn)品截圖加以說明：

大語言模型實現(xiàn)智能客服知識庫文檔數(shù)據(jù)提取功能

Z廠的企業(yè)資料庫，關(guān)聯(lián)大語言模型自動搜索

大語言模型實現(xiàn)智能客服知識庫文檔數(shù)據(jù)提取功能

T廠的大模型文檔知識抽取和“即搜即問”

期待更多更好的應(yīng)用落地，有對這方面內(nèi)容感興趣的朋友，歡迎隨時聯(lián)系。

本文由 @通信產(chǎn)品的那些事翻譯發(fā)布于人人都是產(chǎn)品經(jīng)理，未經(jīng)作者許可，禁止轉(zhuǎn)載。

題圖來自Unsplash，基于CC0協(xié)議。

該文觀點僅代表作者本人，人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。

更多精彩內(nèi)容，請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App

通信產(chǎn)品的那些事

通信類產(chǎn)品老兵。當(dāng)過正規(guī)軍，干過游擊隊

21篇作品 128559總閱讀量

用大廠APP告訴你：這14個技巧可以優(yōu)化“評論區(qū)”

03-076611 瀏覽

抽獎營銷活動方案

01-0516222 瀏覽

大廠齊出海：字節(jié)忙種草，網(wǎng)易愛社交

04-273630 瀏覽

Axure高保真教程：拖拉拽放大縮小和移動元件

03-096226 瀏覽

工業(yè)軟件的產(chǎn)品設(shè)計——從選擇功能談起

07-054447 瀏覽

評論

.

你還可以試試T廠的TextIn的智能文檔抽取，是這個T廠嗎

最近來自上海回復(fù)
產(chǎn)品蝶道

求帶，求加入！

最近來自北京回復(fù)
Outsider

t廠，z廠是啥廠

最近來自廣東回復(fù)
1. 產(chǎn)品蝶道回復(fù)Outsider
  
  看界面截圖logo，Z廠是客服領(lǐng)域的獨角獸，智齒科技。T廠盲猜是騰訊企點？
  
  最近來自北京回復(fù)
汪仔5977

”T廠的大模型文檔知識抽取和“即搜即問”截圖，是一個什么樣的系統(tǒng)？可以介紹下嗎？

最近來自廣東回復(fù)
云計算JACK

辛苦了

最近來自上海回復(fù)
1. 產(chǎn)品蝶道回復(fù)云計算JACK
  
  又碰到了哈哈哈哈
  
  最近來自北京回復(fù)