16張卡2個(gè)月訓(xùn)練百萬病理切片,華為DCS AI解決方案如何做到?

極客網(wǎng)·人工智能 近期,DeepSeek的火爆引發(fā)了AI產(chǎn)業(yè)對(duì)低成本、高效率大模型訓(xùn)練的廣泛討論。今日,醫(yī)療AI領(lǐng)域新發(fā)布的瑞金醫(yī)院瑞智病理大模型RuiPath也憑借其高效訓(xùn)練和落地應(yīng)用,成為行業(yè)關(guān)注的焦點(diǎn)。

image001.png

RuiPath由華為DCS AI解決方案助力打造,僅用16張計(jì)算卡、歷時(shí)2個(gè)月,便完成了超100萬張病理切片的訓(xùn)練,實(shí)現(xiàn)了醫(yī)療行業(yè)專家大模型的成功落地。這一成就不僅展示了“花小錢辦大事”的可能性,更為行業(yè)大模型的高效訓(xùn)練提供了范例。

三大挑戰(zhàn)阻礙AI大模型行業(yè)化落地

與互聯(lián)網(wǎng)領(lǐng)域的通用大模型不同,行業(yè)用戶更關(guān)注如何將通用大模型轉(zhuǎn)化為專業(yè)大模型,以釋放其真正的價(jià)值。然而,這一過程面臨三大挑戰(zhàn)。

23456.jpg

首先,在數(shù)據(jù)層面,從通用大模型到行業(yè)場(chǎng)景大模型,針對(duì)性訓(xùn)練所需的數(shù)據(jù)預(yù)處理耗時(shí)長(zhǎng),收集、清洗等環(huán)節(jié)往往占據(jù)模型開發(fā)訓(xùn)練時(shí)長(zhǎng)的60%。例如,瑞金醫(yī)院擁有海量的圖像、文本等多模態(tài)數(shù)據(jù),覆蓋臨床、影像、病理等多個(gè)領(lǐng)域,這些數(shù)據(jù)在訓(xùn)練前需要進(jìn)行完備的標(biāo)簽化處理,才能開展精準(zhǔn)的模型訓(xùn)練。

其次,在算法層面,行業(yè)場(chǎng)景模型的訓(xùn)練和應(yīng)用落地難度大,開發(fā)周期不可控,且對(duì)人員技術(shù)要求高。非互聯(lián)網(wǎng)科技行業(yè)的企業(yè)通常缺乏足夠的AI技術(shù)人才,需要簡(jiǎn)單易用的開發(fā)平臺(tái)來降低門檻,使行業(yè)人員也能輕松上手。

最后,在算力層面,由于算力等待、任務(wù)潮汐、資源碎片化等原因,AI集群的可用度通常不足50%。多數(shù)行業(yè)無法大量采購(gòu)計(jì)算卡來實(shí)現(xiàn)大模型的落地,因此必須從一開始就考慮訓(xùn)練和推理任務(wù)的降本增效。

華為DCS AI解決方案的三大核心價(jià)值

針對(duì)這些挑戰(zhàn),華為DCS AI解決方案通過ModelEngine工具鏈、XPU池化和容器技術(shù)以及融合數(shù)據(jù)湖等關(guān)鍵能力,成功解決了數(shù)據(jù)工程處理慢、模型/應(yīng)用對(duì)接難、AI系統(tǒng)可用度低的三大問題,并在醫(yī)療病理場(chǎng)景中展現(xiàn)出顯著優(yōu)勢(shì)。

12345.jpg

首先,數(shù)據(jù)工程工具化將醫(yī)療訓(xùn)練數(shù)據(jù)準(zhǔn)備周期縮短了80%。方案將病理數(shù)據(jù)統(tǒng)一為高壓縮、低時(shí)延的CSP格式,實(shí)現(xiàn)數(shù)據(jù)標(biāo)準(zhǔn)化,并通過Omni-Dataverse技術(shù)實(shí)現(xiàn)跨院區(qū)數(shù)據(jù)的統(tǒng)一管理。ModelEngine內(nèi)置40多種數(shù)據(jù)處理算子,其中獨(dú)有的CSP免patch切分算子,將百萬級(jí)切片預(yù)處理時(shí)間從月級(jí)縮短到天級(jí)。

其次,系統(tǒng)級(jí)模型訓(xùn)練與推理加速能力將模型訓(xùn)練周期縮短了30%,推理并發(fā)能力提升了一倍。高性能分布式文件存儲(chǔ)系統(tǒng)支持NDS存算協(xié)同和KVCache智能分級(jí)緩存,減少重復(fù)計(jì)算,提升數(shù)據(jù)加載效率。SmartAI智能調(diào)度引擎結(jié)合XPU池化技術(shù),有效提升了AI集群的可用度。

最后,極簡(jiǎn)應(yīng)用開發(fā)平臺(tái)支持低代碼開發(fā)、可視調(diào)測(cè)、自動(dòng)評(píng)估、一鍵部署和零代碼維護(hù),將應(yīng)用上線周期縮短了80%。此外,華為還開源了ModelEngine版本,幫助集成商搭建個(gè)性化的AI應(yīng)用開發(fā)平臺(tái)。

行業(yè)大模型落地的“DeepSeek范式”

最終,在華為DCS AI解決方案的助力下,RuiPath僅用2個(gè)月便完成了300余本病理診斷書籍和100萬張數(shù)字切片的訓(xùn)練,顯著提升了醫(yī)療行業(yè)專家模型的訓(xùn)練、推理及精調(diào)效率,同時(shí)有效降低了部署成本。

微信圖片_20250220141018.jpg

據(jù)瑞金醫(yī)院病理醫(yī)生介紹,RuiPath在病理診斷常用問題測(cè)試中準(zhǔn)確率超過90%,在醫(yī)學(xué)圖文問答任務(wù)中處于國(guó)際領(lǐng)先水平。AI互動(dòng)式閱片將單切片診斷時(shí)間從5-10分鐘縮短至秒級(jí),醫(yī)生的工作模式也從鏡下找病灶轉(zhuǎn)變?yōu)閷徍薃I診斷結(jié)果,顯著提升了診斷效率。

從中可見,行業(yè)大模型落地也迎來了自己的“DeepSeek范式”。華為DCS AI解決方案不僅助力瑞金醫(yī)院RuiPath在醫(yī)療行業(yè)打造成功實(shí)踐,更為其他行業(yè)的AI大模型落地提供了低成本、高效率的選擇,有望推動(dòng)了AI大模型在更多領(lǐng)域落地生根!


(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )

贊助商
2025-02-20
16張卡2個(gè)月訓(xùn)練百萬病理切片,華為DCS AI解決方案如何做到?
行業(yè)大模型落地迎來自己的“DeepSeek范式”

長(zhǎng)按掃碼 閱讀全文