AI系統(tǒng)有助于醫(yī)學民主化

來源:https://www.nature.com/articles/d41586-024-00099-4

經(jīng)過訓練進行醫(yī)學訪談的人工智能系統(tǒng)在與模擬患者交談和根據(jù)患者病史列出可能的診斷方面的表現(xiàn)與人類醫(yī)生的表現(xiàn)相匹配,甚至超過了人類醫(yī)生的水平。

該聊天機器人基于谷歌開發(fā)的大型語言模型(LLM),在診斷呼吸和心血管疾病等方面比委員會認證的初級保健醫(yī)生更準確。與人類醫(yī)生相比,它在醫(yī)學訪談中獲得了相似數(shù)量的信息,并且在同理心方面排名更高。

“據(jù)我們所知,這是對話式人工智能系統(tǒng)首次被優(yōu)化設(shè)計用于診斷對話和獲取臨床病史,”倫敦谷歌健康公司的臨床研究科學家Alan Karthikesalingam說,他也是該研究的合著者,該研究于1月11日發(fā)表在arXiv預印本庫中。它尚未經(jīng)過同行評審。

這款聊天機器人被稱為“清晰醫(yī)學智能探索者”(AMIE),目前仍處于純實驗階段。它還沒有在有真正健康問題的人身上進行測試,只在受過訓練的演員身上進行了測試。Karthikesalingam說:“我們希望以謹慎和謙遜的態(tài)度來解釋結(jié)果?!?。

盡管聊天機器人遠未用于臨床護理,但作者認為,它最終可能在醫(yī)療保健民主化方面發(fā)揮作用。馬薩諸塞州波士頓哈佛醫(yī)學院的內(nèi)科醫(yī)師Adam Rodman說,該工具可能會有所幫助,但不應該取代與醫(yī)生的互動。他說:“醫(yī)學不僅僅是收集信息,而是關(guān)乎人際關(guān)系?!?。

很少有人試圖利用LLM進行醫(yī)學研究,探討這些系統(tǒng)是否可以模仿醫(yī)生記錄一個人的病史并利用其進行診斷的能力。羅德曼說,醫(yī)學生為了做到這一點,花了很多時間進行訓練?!斑@是向醫(yī)生灌輸?shù)淖钪匾彩亲罾щy的技能之一?!?/p>

加州山景城谷歌健康的人工智能研究科學家、該研究的合著者Vivek Natarajan表示,開發(fā)人員面臨的一個挑戰(zhàn)是缺乏可用作訓練數(shù)據(jù)的真實世界醫(yī)學對話。為了應對這一挑戰(zhàn),研究人員為聊天機器人設(shè)計了一種訓練自己“對話”的方法。

研究人員利用現(xiàn)有的真實世界數(shù)據(jù)集,如電子健康記錄和轉(zhuǎn)錄的醫(yī)療對話,對基本LLM進行了第一輪微調(diào)。為了進一步訓練該模型,研究人員促使LLM扮演一個患有特定疾病的人的角色,以及一個富有同情心的臨床醫(yī)生的角色,目的是了解這個人的病史并設(shè)計潛在的診斷。

該團隊還要求該模型再扮演一個角色:一個評論家,他評估醫(yī)生與被治療者的互動,并就如何改善這種互動提供反饋。這種批評被用來進一步訓練LLM并產(chǎn)生改進的對話。

為了測試該系統(tǒng),研究人員招募了20名受過模擬患者培訓的人,并讓他們與AMIE和20名委員會認證的臨床醫(yī)生進行在線文本咨詢。他們沒有被告知是在和人類聊天還是在和機器人聊天。

參與者模擬了149個臨床場景,然后被要求評估他們的經(jīng)驗。一組專家還對AMIE和醫(yī)生的表現(xiàn)進行了評級。

人工智能系統(tǒng)在所測試的所有六個醫(yī)學專業(yè)中都達到或超過了醫(yī)生的診斷準確性。該機器人在26項談話質(zhì)量標準中的24項方面優(yōu)于醫(yī)生,包括禮貌、解釋病情和治療、給人的印象誠實以及表達關(guān)心和承諾。

Karthikesalingam說:“這絕不意味著語言模型在獲取臨床病史方面比醫(yī)生更好?!?。他指出,研究中的初級保健醫(yī)生可能不習慣通過基于文本的聊天與患者互動,這可能會影響他們的表現(xiàn)。

Karthikesalingam說,相比之下,LLM有一個不公平的優(yōu)勢,那就是能夠快速寫出長而結(jié)構(gòu)優(yōu)美的答案,讓它能夠始終如一地考慮問題而不感到疲憊。

他說,這項研究的下一個重要步驟是進行更詳細的研究,以評估潛在的偏見,并確保該系統(tǒng)在不同人群中是公平的。谷歌團隊也開始研究在有真正醫(yī)療問題的人身上測試該系統(tǒng)的道德要求。

新加坡杜克大學-新加坡國立大學醫(yī)學院的臨床醫(yī)生人工智能科學家Daniel Ting同意,為了確保算法不會懲罰訓練數(shù)據(jù)集中沒有很好代表性的種族群體,調(diào)查系統(tǒng)的偏見至關(guān)重要。

Ting說,聊天機器人用戶的隱私也是需要考慮的一個重要方面。他說:“對于目前許多商業(yè)大型語言模型平臺,我們?nèi)匀徊淮_定數(shù)據(jù)存儲在哪里以及如何分析?!薄?/p>

(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )

贊助商
2024-01-17
AI系統(tǒng)有助于醫(yī)學民主化
經(jīng)過訓練進行醫(yī)學訪談的人工智能系統(tǒng)在與模擬患者交談和根據(jù)患者病史列出可能的診斷方面的表現(xiàn)與人類醫(yī)生的表現(xiàn)相匹配,甚至超過了人類醫(yī)生的水平。

長按掃碼 閱讀全文