第一!醫(yī)渡科技大模型登頂上海AI實驗室權威評測榜

5月9日,面向中文醫(yī)療大語言模型的開放評測平臺MedBench更新評測榜單,醫(yī)渡科技大模型(評測名:HH-YIDU-Med)以綜合得分61.3分的出色成績登頂榜首,成為榜單中首個綜合評分超過60的醫(yī)療大模型。

MedBench評測榜單節(jié)選

MedBench是由上海AI實驗室和上海市數字醫(yī)學創(chuàng)新中心推出的權威評測平臺,依托頂級醫(yī)療機構的專家經驗和知識儲備,設置了醫(yī)學語言理解、醫(yī)學語言生成、醫(yī)學知識問答、復雜醫(yī)學推理和醫(yī)療安全和倫理等5大維度,共包含15項任務、20個數據集及30萬道題目,為中文醫(yī)療大模型提供客觀科學的性能評測參考。

MedBench榜單評測維度

醫(yī)療行業(yè)因其獨有的專業(yè)度和嚴謹性,對醫(yī)療大模型的能力提出了極高要求。盡管GPT-4已經在通用大模型領域取得了顯著的突破,但由于醫(yī)療文本和知識的特殊性,即使是GPT-4在處理醫(yī)療場景的真實問題時,如果未經專門訓練也無法取得很好的成績。醫(yī)渡科技大模型在醫(yī)學知識問答、醫(yī)學語言理解、醫(yī)療安全和倫理三大關鍵維度中都拔得頭籌,充分展現了其在專業(yè)性、理解力、邏輯性和安全性等方面的醫(yī)療專業(yè)實力。

作為國內醫(yī)療智能行業(yè)的頭部企業(yè),醫(yī)渡科技在醫(yī)療智能領域深耕近10年,其“醫(yī)療智能大腦”YiduCore經授權處理分析了超過40多億份醫(yī)療記錄,沉淀了大量多維度可量化的知識圖譜。醫(yī)渡科技大模型的構建不僅基于對大量臨床實踐指南、醫(yī)學文獻的篩選治理,還應用自研的數據生成技術,將多年實踐積累的知識圖譜用于大模型訓練,從而顯著提升了模型在醫(yī)學領域的專業(yè)性能和準確性,增強了大模型生成內容的真實性和可解釋性。

醫(yī)渡科技大模型的優(yōu)秀表現,得益于公司在醫(yī)療知識和知識圖譜方面的積累,也離不開其在模型架構和算法方面的不斷創(chuàng)新。醫(yī)渡科技具備從硬件組網到訓練微調、推理的完整技術能力,國內外主流芯片軟硬件全棧適配。并且自研了針對醫(yī)療數據特點的專利技術,進一步提升了模型在醫(yī)學語言理解、醫(yī)療安全等方面的專業(yè)能力。此外,醫(yī)渡科技還采用了數據增強和對抗訓練等技術,以提升模型的魯棒性。

作為“醫(yī)療大腦”YiduCore的核心算法,醫(yī)渡科技大模型為醫(yī)療健康產業(yè)各應用場景提供易使用、高質量、可定制的強大賦能。面向B端,醫(yī)渡科技大模型能夠利用強大的專業(yè)能力助力“醫(yī)、教、研、管”等場景各個環(huán)節(jié)提質增效,公司原有的數據治理、醫(yī)院管理、臨床科研、臨床診療等多個場景的解決方案都基于大模型技術進行了升級;面向C端用戶,醫(yī)渡科技大模型提供專業(yè)醫(yī)學級別的個性化服務,包括報告解讀、健康問答、導診咨詢等等。目前醫(yī)渡科技大模型正由大語言模型向多模態(tài)大模型升級,從而滿足更多場景的應用需求。

此次登頂MedBench評測榜,醫(yī)渡科技大模型從理解生成“基礎”能力,到復雜推理“進階”能力,再到倫理把控“高級”能力的模型性能都得到了驗證和肯定。醫(yī)渡科技表示,目前取得的成績只是一個開始,醫(yī)療大模型還有很長的路要走。公司將繼續(xù)穩(wěn)步前行,不斷突破創(chuàng)新,以實現醫(yī)療人工智能的更大潛力,推動大模型技術向更高水平發(fā)展,實現大模型技術在多領域場景下的滲透和應用,加速推動醫(yī)療行業(yè)的智能化轉型升級。

(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )