AI輔助診斷的幻覺問題是源自數(shù)據(jù)忽略

羅福如
1 評論 933 瀏覽 1 收藏 4 分鐘
🔗 B端产品经理需要进行售前演示、方案定制、合同签订等,而C端产品经理需要进行活动策划、内容运营、用户激励等

在醫(yī)療診斷領(lǐng)域,人工智能技術(shù)的應(yīng)用正日益普及,但其準(zhǔn)確性和可靠性仍然是公眾和專業(yè)人士關(guān)注的焦點(diǎn)。本文深入探討了AI輔助診斷中存在的挑戰(zhàn),特別是AI如何突破人類醫(yī)生診斷準(zhǔn)確率的“天花板”,以及如何識別和利用那些可能被人類醫(yī)生忽視的隱藏特征。

前段時(shí)間讀了杰羅姆·格魯普曼的《醫(yī)生如何思考》(How Doctors Think)。這本書我覺得任何接受過重大治療的人都應(yīng)該讀一下,它會徹底改變你對醫(yī)生的看法。書里提到一個(gè)讓我震驚的事實(shí):即使是通過委員會認(rèn)證的放射科醫(yī)生,他們大約有 15% 的時(shí)間會對自己的診斷意見不一致(如果沒記錯(cuò)的話)。

讓我好奇的是,既然人類醫(yī)生都有這種限制,那我們怎么讓人工智能的診斷準(zhǔn)確率比人類高?

目前的方法,比如放射科醫(yī)生的診斷,準(zhǔn)確率可能在 95% 左右。如果我們用這些準(zhǔn)確率只有 95% 的方法來訓(xùn)練 AI,那么 AI 怎么能突破這條“天花板”?它需要一些我們還沒意識到的知識來提高到 99.999% 的準(zhǔn)確度,但這些知識我們自己卻并不知道它們是什么。

舉個(gè)極端但形象的例子。假設(shè)有種叫紅流感的疾病,患者臉上會出現(xiàn)紅點(diǎn),這點(diǎn)大家都知道,但更少人注意到的是,這種病可能會在發(fā)病前四周讓腳趾甲變紫。人類醫(yī)生可能永遠(yuǎn)不會發(fā)現(xiàn)這個(gè)細(xì)節(jié),但 AI 可能會自動發(fā)現(xiàn)兩者的聯(lián)系。問題是,我們?nèi)绾沃鲃诱业竭@些“紫腳趾甲”式的隱藏特征?

更復(fù)雜的是,我們的數(shù)據(jù)本身可能會欺騙 AI。拿肺癌來說,訓(xùn)練數(shù)據(jù)相對簡單。我們可以只用活檢確認(rèn)過的癌癥患者的 CT 和 XR(而不是那些放射科醫(yī)生懷疑有癌癥但未確診的樣本),這樣訓(xùn)練出來的 AI 特異性幾乎是 100%。敏感性如何?這很難說,但實(shí)際上人類醫(yī)生的敏感性也沒有明確的標(biāo)準(zhǔn)。

但如果是肺炎,情況就完全不同了。肺炎沒有像活檢一樣的“金標(biāo)準(zhǔn)”來驗(yàn)證,診斷往往依賴 XR 上的特征和醫(yī)生的經(jīng)驗(yàn)判斷。訓(xùn)練數(shù)據(jù)不可避免會摻雜噪聲,這種情況下,AI 的特異性一定低于 100%。

不過即便如此,AI 的一致性可能讓它在實(shí)際表現(xiàn)中仍然優(yōu)于平均水平的醫(yī)生。即便訓(xùn)練數(shù)據(jù)并不完美,AI 也有可能接近頂級放射科醫(yī)生的表現(xiàn),這比普通醫(yī)生要好得多。

然而,AI 還有一個(gè)問題是它的“黑箱”屬性。我們不知道它在檢測癌癥時(shí)究竟看到了什么,忽略了什么,也無法完全理解它的決策過程。就像醫(yī)學(xué)本身更像一場概率游戲一樣,AI 也并非絕對確定的工具。

本文由人人都是產(chǎn)品經(jīng)理作者【羅福如】,微信公眾號:【羅福如】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 畢竟ai大模型就是用大量的數(shù)據(jù)訓(xùn)練出來的,總有沒訓(xùn)練到位的地方。

    來自廣東 回復(fù)
专题
145672人已学习15篇文章
作为产品经理,你多多少少得懂点技术。
专题
11446人已学习12篇文章
本专题的文章分享了情人节的营销思路。
专题
12253人已学习12篇文章
在各大产品中,都离不开会员体系的建立,那么会员权益模块产品该如何设计?本专题的文章分享了会员权益设计的思考
专题
15857人已学习12篇文章
采购管理是对采购业务过程进行组织、实施与控制的管理过程。本专题的文章提供了采购管理设计指南。
专题
13002人已学习11篇文章
内容管理系统是一种位于WEB 前端(Web 服务器)和后端办公系统或流程(内容创作、编辑)之间的软件系统。本专题的文章分享了内容管理系统(CMS)的设计指南。