醫(yī)渡科技CTO閆峻:醫(yī)療行業(yè)需要高質(zhì)量的專業(yè)垂類大模型

近日,中金公司舉辦2023年中期策略會(huì),眾多上市公司高管、行業(yè)專家圍繞行業(yè)前沿?zé)狳c(diǎn)、未來(lái)趨勢(shì)展開深入探討,醫(yī)渡科技CTO、首席人工智能科學(xué)家閆峻博士受邀參會(huì),并發(fā)表了《AI的技術(shù)發(fā)展與醫(yī)療領(lǐng)域商業(yè)應(yīng)用》主題演講,分享了AI在醫(yī)療產(chǎn)業(yè)的應(yīng)用與發(fā)展進(jìn)程,指出由于醫(yī)療領(lǐng)域的嚴(yán)肅性、敏感性、專業(yè)性等特殊性,醫(yī)療行業(yè)需要高質(zhì)量的專業(yè)大模型。

01

從專家系統(tǒng)到大模型時(shí)代,醫(yī)療AI迎來(lái)新機(jī)遇

隨著人工智能技術(shù)的不斷發(fā)展,AI在醫(yī)療領(lǐng)域的應(yīng)用也經(jīng)歷了從基于符號(hào)邏輯的知識(shí)推理到統(tǒng)計(jì)機(jī)器學(xué)習(xí)到深度學(xué)習(xí)再到大模型時(shí)代的演進(jìn)。

AI 1.0以基于數(shù)理邏輯的符號(hào)邏輯為基礎(chǔ),被稱為專家系統(tǒng),這一階段產(chǎn)生的代表性醫(yī)療AI產(chǎn)品是基于符號(hào)知識(shí)推理的臨床決策支持系統(tǒng)(CDSS),通過(guò)嚴(yán)謹(jǐn)?shù)倪壿嬐评砗推ヅ涞姆绞?來(lái)幫助醫(yī)生進(jìn)行診斷與治療推薦。但專家系統(tǒng)存在構(gòu)建成本高和泛化能力差兩個(gè)主要局限性,其需要對(duì)每種疾病甚至每個(gè)醫(yī)生的觀點(diǎn)進(jìn)行構(gòu)建,且如果構(gòu)建時(shí)沒有涵蓋患者的個(gè)性化信息,比如當(dāng)前用藥及并發(fā)癥等,就無(wú)法進(jìn)行推理,這也是這一代的CDSS未得到廣泛應(yīng)用的重要原因之一。

AI 2.0是機(jī)器學(xué)習(xí)時(shí)代,統(tǒng)計(jì)機(jī)器學(xué)習(xí)被應(yīng)用于疾病早篩預(yù)測(cè)、患病風(fēng)險(xiǎn)預(yù)測(cè)等諸多領(lǐng)域。然而,盡管醫(yī)學(xué)科研課題中有很多應(yīng)用機(jī)器學(xué)習(xí)的研究,但商業(yè)化應(yīng)用的成功案例卻很少。其中一個(gè)重要原因在于早期的機(jī)器學(xué)習(xí)技術(shù)極度依賴于模型假設(shè),學(xué)習(xí)能力不足,而在實(shí)際應(yīng)用中,許多模型假設(shè)無(wú)法預(yù)知或不成立,導(dǎo)致該技術(shù)在商業(yè)化方面的模型效果和泛化能力不足。

AI 3.0是在AI 2.0機(jī)器學(xué)習(xí)的基礎(chǔ)上經(jīng)過(guò)深度學(xué)習(xí)+大數(shù)據(jù)驅(qū)動(dòng)的技術(shù)進(jìn)步。深度學(xué)習(xí)技術(shù)在醫(yī)學(xué)影像等特定領(lǐng)域取得了顯著成果,但很多公司也面臨著虧損的困境。因?yàn)樵摷夹g(shù)需要針對(duì)特定任務(wù)投入高昂的成本,如果單一任務(wù)場(chǎng)景商業(yè)化收益有限,難以收回訓(xùn)練成本且難以直接應(yīng)用于其它任務(wù)。

當(dāng)前,我們已處于AI發(fā)展的第四個(gè)高潮階段-大模型時(shí)代。閆峻博士表示,隨著計(jì)算能力和數(shù)據(jù)規(guī)模的增加,大模型的出現(xiàn)使得AI系統(tǒng)能夠處理更加復(fù)雜和龐大的任務(wù),提高了模型的表現(xiàn)能力和泛化能力,這給醫(yī)療產(chǎn)業(yè)應(yīng)用也帶來(lái)了新的機(jī)會(huì)??煞夯裳C的CDSS、可處理復(fù)雜納排條件的病歷檢索、可以給出科研靈感的科研工具……醫(yī)療產(chǎn)業(yè)鏈上的許多痛點(diǎn),或許都可以通過(guò)大模型技術(shù)解決,醫(yī)療AI的發(fā)展正進(jìn)入新的商業(yè)化時(shí)代。

02

醫(yī)療行業(yè)需要高質(zhì)量的專業(yè)垂類大模型

面對(duì)大模型帶來(lái)的巨大機(jī)遇,垂直領(lǐng)域的企業(yè)如何擁抱AI新時(shí)代?

閆峻博士指出,一般會(huì)有兩條路徑選擇。一是在第三方大模型的基礎(chǔ)上經(jīng)過(guò)微調(diào)和提示等手段去做應(yīng)用,這種方式門檻以及開發(fā)成本和時(shí)間投入都會(huì)較低,可以快速實(shí)現(xiàn)應(yīng)用場(chǎng)景落地;另一種則是構(gòu)建垂直行業(yè)領(lǐng)域的垂域大模型,需要投入較高的資源和技術(shù),但實(shí)現(xiàn)后會(huì)有自己的核心價(jià)值門檻。

閆峻博士更傾向于第二條路徑。他表示,一方面是考慮到隱私保護(hù)問題,醫(yī)療健康領(lǐng)域涉及到大量敏感數(shù)據(jù),因此數(shù)據(jù)安全是醫(yī)療AI產(chǎn)業(yè)發(fā)展的底線,選擇調(diào)用海外模型API形式可能會(huì)牽涉到數(shù)據(jù)跨境等一系列數(shù)據(jù)安全隱私問題,存在一定風(fēng)險(xiǎn)。

另一方面則是由于醫(yī)療行業(yè)的專業(yè)性要求高。醫(yī)療行業(yè)嚴(yán)肅、謹(jǐn)慎,要求高精準(zhǔn)度,通用大模型雖然極其智能且具備廣泛的適應(yīng)性,但缺乏深入的醫(yī)療專業(yè)領(lǐng)域知識(shí)、經(jīng)驗(yàn)及復(fù)雜推理過(guò)程,在醫(yī)療場(chǎng)景實(shí)際應(yīng)用時(shí)可能無(wú)法提供足夠?qū)I(yè)和準(zhǔn)確的回答。當(dāng)前,無(wú)論是GPT-4,還是其它通用大語(yǔ)言模型,均存在“AI幻覺”的問題。

因此,為了數(shù)據(jù)安全以及模型的專業(yè)性,醫(yī)療行業(yè)需要基于專業(yè)語(yǔ)料、高質(zhì)量數(shù)據(jù)的醫(yī)療垂直領(lǐng)域大語(yǔ)言模型。盡管這條路會(huì)更難,但閆峻相信,垂類大模型會(huì)在整個(gè)醫(yī)療健康產(chǎn)業(yè)中發(fā)揮更大價(jià)值。

03

醫(yī)療垂類大模型開發(fā)門檻更高

然而,要想開發(fā)出可靠、準(zhǔn)確且有實(shí)際應(yīng)用價(jià)值的醫(yī)療垂直領(lǐng)域大模型,自然門檻也非常高。

醫(yī)療領(lǐng)域知識(shí)體系極其龐大,因此首先需要具備足夠的專業(yè)醫(yī)療知識(shí)儲(chǔ)備,包括醫(yī)學(xué)基礎(chǔ)知識(shí)、臨床常識(shí)、術(shù)語(yǔ)理解、臨床思維、診療規(guī)范理解等等。醫(yī)渡科技已經(jīng)在醫(yī)療智能領(lǐng)域深耕多年,始終利用AI技術(shù)賦能監(jiān)管機(jī)構(gòu)、醫(yī)院、藥企、險(xiǎn)企和患者,覆蓋了超過(guò)1000家醫(yī)院,積累了大量的醫(yī)學(xué)知識(shí)和洞見。

其次還需要具備NLP、深度學(xué)習(xí)等AI技術(shù)實(shí)力,尤其是算法創(chuàng)新能力,直接影響大模型的性能、效果和計(jì)算效率。閆峻博士強(qiáng)調(diào),醫(yī)療行業(yè)也需要包括基于情感計(jì)算的醫(yī)學(xué)人文關(guān)懷在內(nèi)的特殊考量。醫(yī)渡科技一直在堅(jiān)持AI創(chuàng)新技術(shù)投入,自主研發(fā)了“醫(yī)療智能大腦”YiduCore,其具備強(qiáng)大的數(shù)據(jù)處理能力,在NLP、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、知識(shí)突破等AI核心技術(shù)領(lǐng)域都有著深厚的技術(shù)儲(chǔ)備。

高素質(zhì)的交叉人才隊(duì)伍也是不可或缺的,包括醫(yī)學(xué)專家、數(shù)據(jù)科學(xué)家、算法工程師等多個(gè)領(lǐng)域的專業(yè)人才,醫(yī)渡科技內(nèi)部人才團(tuán)隊(duì)80%以上都具備醫(yī)學(xué)或人工智能背景。

閆峻博士還在會(huì)上表示,醫(yī)療AI要想形成產(chǎn)業(yè)化的發(fā)展,需要落實(shí)到醫(yī)療行業(yè)各個(gè)產(chǎn)業(yè)鏈中,如果只是在某個(gè)單一環(huán)節(jié)具有應(yīng)用,很難帶動(dòng)整個(gè)產(chǎn)業(yè)的發(fā)展。這與醫(yī)療AI“四起三落”的歷史規(guī)律是一致的,只有形成生態(tài)閉環(huán),才能實(shí)現(xiàn)可持續(xù)發(fā)展。醫(yī)渡科技的智能應(yīng)用及解決方案已經(jīng)覆蓋了醫(yī)療行業(yè)的供給方、監(jiān)管方、支付方和需求方,衍生出了許多成功的商業(yè)化場(chǎng)景和產(chǎn)品,賦能臨床研究、醫(yī)療管理、新藥研發(fā)、區(qū)域公共衛(wèi)生與人口健康管理、健康保險(xiǎn)等醫(yī)療健康產(chǎn)業(yè)的各個(gè)領(lǐng)域,積累了豐富的落地經(jīng)驗(yàn)。

閆峻博士最后表示,垂類大模型的前景無(wú)疑非常廣闊,但仍需要企業(yè)腳踏實(shí)地。醫(yī)渡科技作為醫(yī)療智能頭部企業(yè),持續(xù)關(guān)注人工智能領(lǐng)域的最新前沿科技發(fā)展,并將不斷在醫(yī)療垂類領(lǐng)域進(jìn)行探索及自主創(chuàng)新,秉持著“綠色醫(yī)療”的初心,以技術(shù)助力更多患者受益,為醫(yī)療AI的健康發(fā)展以及人類健康貢獻(xiàn)力量。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )