大語言模型實現(xiàn)智能客服知識庫文檔數(shù)據(jù)提取功能

7 評論 10212 瀏覽 71 收藏 9 分鐘

智能客服的知識庫有兩類:機(jī)器人知識庫和坐席知識庫,分別是為機(jī)器人和坐席進(jìn)行服務(wù)時,提供數(shù)據(jù)的支撐。如何通過大語言模型,讓企業(yè)的文檔可批量上傳,無需更多的整理,直接轉(zhuǎn)化為有效的QA,供座席和機(jī)器人直接調(diào)用呢?本文作者對此進(jìn)行了分析,一起來看一下吧。

上一篇提到了《大語言模型實現(xiàn)智能客服知識庫自動擴(kuò)寫功能》,這次談下知識庫文檔數(shù)據(jù)提取功能的實現(xiàn)。

一、產(chǎn)品場景和需求

我們知道智能客服的知識庫有兩類:機(jī)器人知識庫和座席知識庫。

分別是為機(jī)器人和座席進(jìn)行服務(wù)時,提供數(shù)據(jù)的支撐。

智能客服系統(tǒng)會標(biāo)配知識庫管理功能,常見的形式是樹狀結(jié)構(gòu),提供分類管理、知識庫條目管理,并支持知識庫的批量導(dǎo)入導(dǎo)出操作。

使用中,企業(yè)需要經(jīng)常性地維護(hù)管理知識庫內(nèi)容,將企業(yè)已有知識內(nèi)容文檔上傳,但如果是將原文件上傳,則系統(tǒng)最多能支持預(yù)覽功能,使用者在操作界面只能點擊打開全文檢索。而如果是機(jī)器人知識庫,直接上傳文檔是不可用的,需要操作者手工整理文檔中的內(nèi)容為機(jī)器人標(biāo)準(zhǔn)問答對。

以上是目前絕大多數(shù)主流產(chǎn)品的使用情況。

大語言模型來了,我們提出的需求很簡單,所有企業(yè)的文檔可以批量上傳,無需更多的整理,直接可自動轉(zhuǎn)化為有效的QA,供座席和機(jī)器人直接調(diào)用。

二、知識提取實測:PDF文檔內(nèi)容提取

已有諸多產(chǎn)品使用大語言模型實現(xiàn)PDF文檔數(shù)據(jù)提取,我們先看下已實現(xiàn)的產(chǎn)品的效果。

1. ChatPDF

https://www.chatpdf.com/

界面特別干凈,上傳pdf,然后conversation。

為了測試,我扔了一份100頁的產(chǎn)品手冊進(jìn)來。

上傳速度很快,最關(guān)鍵的時,對話響應(yīng)也非常的快。

對文檔內(nèi)容的解析很準(zhǔn)確,包括一些隱藏在內(nèi)部的知識點也可以快速搜索找到。

大語言模型實現(xiàn)智能客服知識庫文檔數(shù)據(jù)提取功能

2. Pandagpt

https://www.pandagpt.io/

網(wǎng)絡(luò)問題,訪問有點慢,但是這個對話的樣式,一言難盡,沒有一個版塊不是互相遮擋的,強(qiáng)迫癥死敵。

響應(yīng)速度差一些,問題回答基本到位,相比ChatPDF,略顯啰嗦。

大語言模型實現(xiàn)智能客服知識庫文檔數(shù)據(jù)提取功能

3. typeset

https://typeset.io/

主打論文檢索的typeset,也支持pdf文檔解讀。

上傳、對話響應(yīng)都十分緩慢,對話的效果非常不OK,很多知識點無法解讀,一律回復(fù)無法找到這個問題的答案。

三、自研框架的選擇

基于OpenAIEmbeddings,官方給出了基于embeddings檢索來解決GPT無法處理長文本和最新數(shù)據(jù)的問題的實現(xiàn)方案。

參考:https://www.datalearner.com/blog/1051681543488862

也可以使用LangChain框架,參考以下內(nèi)容實現(xiàn)效果。

參考:

ChatGPT怎么建立私有知識庫?:https://www.zhihu.com/question/596838257/answer/3004754396

利用LangChain和國產(chǎn)大模型ChatGLM實現(xiàn)基于本地知識庫的自動問答:https://www.zhihu.com/zvideo/1630964532179812353

另外除了從文檔中抓取數(shù)據(jù),從指定網(wǎng)站URL抓取數(shù)據(jù),實現(xiàn)智能客服外部知識庫,可以借助ChatGPT寫Python代碼,PythonBeautiful Soup庫的實現(xiàn)方式很成熟。

四、智能客服產(chǎn)品設(shè)計要點

回到智能客服產(chǎn)品場景中,產(chǎn)品設(shè)計使用中要考慮的問題。

1)功能分割

建議為保持原知識庫管理系統(tǒng)的完整,可增加單獨的大語言模型知識庫,避免SaaS產(chǎn)品原來的企業(yè)使用體驗和數(shù)據(jù)庫內(nèi)容產(chǎn)生交叉影響。

2)書架式管理

模型知識庫同樣支持分類管理,方便使用者管理文檔庫,能夠快速檢索文檔名稱和內(nèi)容。

提供增刪改查,預(yù)覽、批量上傳刪除等操作。并支持以QA問答對的方式全文展示,使用者可以了解到本文檔新增的有效文檔數(shù)據(jù)有多少內(nèi)容。

3)提供測試對話工具

模型庫中可內(nèi)置對話測試工具,供使用者先行進(jìn)行知識點的維護(hù)管理。

4)知識庫編輯擴(kuò)展

提供插件、支持在線改寫編輯,重新讀取。

減少重復(fù)上傳給使用者帶來的挫敗感。

5)知識庫關(guān)聯(lián)

已測試完成的大模型知識庫,可允許使用者關(guān)聯(lián)發(fā)布到座席或者機(jī)器人知識庫中,提供對話數(shù)據(jù)的擴(kuò)展。

如果是機(jī)器人知識庫,可以在機(jī)器人模板設(shè)置關(guān)聯(lián),允許流程中各節(jié)點選擇性調(diào)用對應(yīng)的知識庫,這樣也不會破壞原有流程的知識庫體系,增強(qiáng)了部分節(jié)點的知識庫能力。

對于交叉引用知識庫的節(jié)點,權(quán)重可以允許調(diào)節(jié),一般默認(rèn)為機(jī)器人自身知識庫為主,大模型知識庫輔助。

6)反饋機(jī)制

文本對話機(jī)器人的訪客端點踩、座席的手工點踩,和語音機(jī)器人的手工標(biāo)記無效問答,都可以幫助反饋大模型知識庫的效果。

以數(shù)據(jù)報表方式展示,手工或自動進(jìn)行知識維護(hù)。

7)功能開關(guān)

最后,仍然是設(shè)置功能性開關(guān),并關(guān)聯(lián)到SaaS產(chǎn)品賬戶角色權(quán)限中,可邀請一部分友好客戶星火測試,不斷迭代優(yōu)化。

當(dāng)然,以上情況,也不限于智能客服產(chǎn)品范疇,一些需要知識管理的場景中,都可以借鑒。

最后還是放出業(yè)內(nèi)大廠們已實現(xiàn)的產(chǎn)品截圖加以說明:

大語言模型實現(xiàn)智能客服知識庫文檔數(shù)據(jù)提取功能

Z廠的企業(yè)資料庫,關(guān)聯(lián)大語言模型自動搜索

大語言模型實現(xiàn)智能客服知識庫文檔數(shù)據(jù)提取功能

大語言模型實現(xiàn)智能客服知識庫文檔數(shù)據(jù)提取功能

T廠的大模型文檔知識抽取和“即搜即問”

期待更多更好的應(yīng)用落地,有對這方面內(nèi)容感興趣的朋友,歡迎隨時聯(lián)系。

本文由 @通信產(chǎn)品的那些事 翻譯發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于CC0協(xié)議。

該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 你還可以試試T廠的TextIn的智能文檔抽取,是這個T廠嗎

    來自上海 回復(fù)
  2. 求帶,求加入!

    來自北京 回復(fù)
  3. t廠,z廠是啥廠

    來自廣東 回復(fù)
    1. 看界面截圖logo,Z廠是客服領(lǐng)域的獨角獸,智齒科技。T廠盲猜是騰訊企點?

      來自北京 回復(fù)
  4. ”T廠的大模型文檔知識抽取和“即搜即問”截圖,是一個什么樣的系統(tǒng)?可以介紹下嗎?

    來自廣東 回復(fù)
  5. 辛苦了

    來自上海 回復(fù)
    1. 又碰到了哈哈哈哈

      來自北京 回復(fù)
专题
133155人已学习23篇文章
产品经理,除了会写竞品分析,还要会写产品分析。
专题
55155人已学习12篇文章
据说70%的问题都是沟通问题,沟通能力对产品经理太太太重要了。
专题
14551人已学习13篇文章
本文作者总结了那些踩过的坑,为大家详细的罗列出了规范的产品管理流程及规范。
专题
12964人已学习12篇文章
要想判断一个行业的趋势,就要做好行业分析。本专题的文章分享了如何撰写行业分析报告。
专题
12878人已学习11篇文章
在工作中我们会跟客户/boss/用户等人对接需求,并把需求交付给设计师/开发等人,那么应该怎么做呢,本专题的文章分享了如何对接和交付需求。
专题
13497人已学习14篇文章
企业架构可以辅助企业完成业务及IT战略规划,还是企业信息化规划的核心,也有助于个人职业的健康长远发展。本专题的文章分享了企业架构详解。