華大基因與華為云的“智慧碰撞”,讓測(cè)序效率穩(wěn)步提升

支付幾百元將你的唾液郵寄,你的基因組序列就會(huì)得到分析,所得出的結(jié)果不僅可以診斷疾病,還可以用于未來(lái)疾病的風(fēng)險(xiǎn)預(yù)測(cè)。相信已經(jīng)有不少人耳聞甚至使用過(guò)這樣的基因測(cè)序“黑科技”產(chǎn)品。

近年來(lái),隨著基因產(chǎn)業(yè)迅速崛起,測(cè)序門檻也越來(lái)越低。如果把人體比作一臺(tái)精密的機(jī)器,基因測(cè)序就好比“人體機(jī)器”的“使用說(shuō)明書(shū)”。隨著未來(lái)基因技術(shù)的不斷發(fā)展,人類或許有能力解讀自己的生命圖紙,并獲得開(kāi)發(fā)人體潛力極限的能力。

目前,基因測(cè)序技術(shù)在基礎(chǔ)研究、技術(shù)研發(fā)和臨床實(shí)踐上已經(jīng)得到了大量應(yīng)用。而這背后離不開(kāi)云計(jì)算、AI、大數(shù)據(jù)等新一代信息技術(shù)的鼎力支持。  

華大基因與華為云的“智慧碰撞”,讓測(cè)序效率穩(wěn)步提升

事實(shí)上,生命科學(xué)的研究競(jìng)賽,很多時(shí)候已經(jīng)變成了一場(chǎng)“算力”的比拼。好的科研成果通常是基于龐大的計(jì)算數(shù)據(jù)。隨著越來(lái)越多臨床基因檢測(cè),如:產(chǎn)前檢測(cè)、腫瘤檢測(cè)等,項(xiàng)目的落地,對(duì)算力的需求也會(huì)逐步增加。那么,該如何為基因測(cè)序提供更強(qiáng)的算力呢?

面對(duì)海量測(cè)序數(shù)據(jù),華大基因的痛點(diǎn)如何化解?

作為全球領(lǐng)先的生命科學(xué)前沿機(jī)構(gòu),目前華大基因已經(jīng)完成HPV檢測(cè)總數(shù)超過(guò)420萬(wàn)例,完成耳聾基因檢測(cè)250余萬(wàn)例,完成無(wú)創(chuàng)產(chǎn)前檢測(cè)510多萬(wàn)例。這些基因測(cè)序的流程中,動(dòng)輒涉及到數(shù)萬(wàn)/數(shù)十萬(wàn)個(gè)基因測(cè)序及模型建立,依賴大量的計(jì)算和存儲(chǔ)資源,隨著未來(lái)業(yè)務(wù)量的那一步擴(kuò)展,將使華大基因的傳統(tǒng)IT架構(gòu)面臨一定挑戰(zhàn):

計(jì)算資源比較緊張,在使用峰值時(shí),任務(wù)經(jīng)常需要排隊(duì)等候;

由于基因測(cè)序?qū)λ懔Φ男枨笫遣▌?dòng)的,通常第四季度的消耗最大而第一季度最少,這會(huì)導(dǎo)致服務(wù)器的數(shù)量無(wú)法得到很好的控制。如果選擇采購(gòu)可以滿足最大峰值的集群,那么在業(yè)務(wù)量不能時(shí)刻保持高峰時(shí),就會(huì)存在很大的成本浪費(fèi)。而一旦服務(wù)器不足,則無(wú)法滿足業(yè)務(wù)高峰時(shí)的測(cè)序任務(wù);

科技服務(wù)部門有很多復(fù)雜基因組,在各個(gè)測(cè)序分析的階段需要借助不同規(guī)格的計(jì)算資源,線下計(jì)算集群往往無(wú)法適應(yīng)快速的擴(kuò)縮容;

此外,線下集群架構(gòu)不支持高通量基因測(cè)序數(shù)據(jù)的多任務(wù)并行,面對(duì)海量基因數(shù)據(jù),每個(gè)基因測(cè)序都是一個(gè)極其消耗計(jì)算資源的過(guò)程,傳統(tǒng)的數(shù)據(jù)存儲(chǔ)和分析方式并不能支持高通量測(cè)序的需求。

華為云基因容器GCS:20分鐘快速部署,成本下降30%

經(jīng)過(guò)多方考量,華大基因選擇了華為云作為合作伙伴。據(jù)悉,華為云在2018年全球首家推出了以Kubernetes為基礎(chǔ)的基因容器服務(wù)GCS,能夠支持集群自動(dòng)擴(kuò)縮容,靈活應(yīng)對(duì)業(yè)務(wù)增長(zhǎng)對(duì)資源帶來(lái)的壓力。當(dāng)測(cè)序需要大量資源時(shí),云平臺(tái)能夠快速擴(kuò)容提升處理能力,解決峰值壓力;在業(yè)務(wù)低谷時(shí),可以釋放資源,降低成本。在不同的測(cè)序分析階段,GCS都能為測(cè)序企業(yè)提供不同規(guī)格的計(jì)算資源。  

華大基因與華為云的“智慧碰撞”,讓測(cè)序效率穩(wěn)步提升

  華為云基因測(cè)序解決方案架構(gòu)/來(lái)源:華為云官網(wǎng)

值得一提的是,在本次項(xiàng)目中,華為云基于輕量級(jí)的容器技術(shù),對(duì)華大基因常用的測(cè)序軟件進(jìn)行了針對(duì)性的優(yōu)化處理。借助容器的高并發(fā)度,每個(gè)節(jié)點(diǎn)上可同時(shí)執(zhí)行多個(gè)任務(wù),帶來(lái)整體計(jì)算性能的提升,一舉解決了線下集群和公有云服務(wù)都難以解決的高通量測(cè)序問(wèn)題,讓基因測(cè)序數(shù)據(jù)的計(jì)算分析更省時(shí)、更輕松。

此外,華為云GCS還具備全自動(dòng)化測(cè)序分析能力,為用戶提帶來(lái)便捷、安心的一站式服務(wù):

借助GCS的生物信息流設(shè)計(jì)器,再?gòu)?fù)雜的業(yè)務(wù)也可以編排到一個(gè)流程中,一鍵搞定測(cè)序任務(wù),避免多套系統(tǒng)操作帶來(lái)的不便;專為國(guó)內(nèi)“生信人”設(shè)計(jì)的流程控制語(yǔ)法,結(jié)構(gòu)簡(jiǎn)練、易懂,既滿足了流程編寫的易用性,同時(shí)也保證了流程遷移的方便性;GCS的流程熱力圖,以非常直觀的方式隨時(shí)了解測(cè)序進(jìn)展,精確掌握資源消耗走勢(shì),指導(dǎo)優(yōu)化方向;還可根據(jù)判斷條件選擇執(zhí)行分支,滿足企業(yè)復(fù)雜的流程管理需求。

目前,華為云團(tuán)隊(duì)已經(jīng)協(xié)助華大基因平滑上云,雙方一起完成超過(guò)300萬(wàn)核時(shí)計(jì)算,平穩(wěn)運(yùn)行超過(guò)100天,實(shí)現(xiàn)了基因測(cè)序環(huán)境快速部署,從過(guò)去的3-5天縮短到僅需20分鐘。與此同時(shí),雙方還通過(guò)構(gòu)建2萬(wàn)核資源池,滿足了海量數(shù)據(jù)、高并發(fā)處理的需求。如今,華大基因已可以靈活應(yīng)對(duì)業(yè)務(wù)波動(dòng),按需使用和釋放計(jì)算資源,在盡可能提升測(cè)序效率的情況下,有效降低測(cè)序工作的IT成本。

華為云GCS助推測(cè)序企業(yè)提升競(jìng)爭(zhēng)力

除了華大基因外,在國(guó)內(nèi)基因行業(yè)Top 15的企業(yè)中,14家選擇了與華為云合作。

其中,武漢未來(lái)組作為國(guó)內(nèi)首家長(zhǎng)讀長(zhǎng)測(cè)序服務(wù)公司,承接了大量動(dòng)植物基因組、轉(zhuǎn)錄組、微生物基因組及宏基因組測(cè)序分析等科研服務(wù)項(xiàng)目,月產(chǎn)出數(shù)據(jù)量高達(dá)數(shù)十Tb。華為云為其提供Kunlun超大內(nèi)存裸金屬服務(wù)器,支持承載重樓百合150G基因組裝,使得測(cè)序原始數(shù)據(jù)處理速度得到快速提升。華為云還協(xié)助未來(lái)組打通了線下數(shù)據(jù)生產(chǎn)平臺(tái)與云端高性能計(jì)算平臺(tái)之間的網(wǎng)絡(luò)鏈路,讓線下產(chǎn)生的數(shù)據(jù)可以快速上傳到云端,從而進(jìn)行后續(xù)的分析。并由華為云專業(yè)的技術(shù)團(tuán)隊(duì)負(fù)責(zé)整體的運(yùn)維管理,大大降低了未來(lái)組的IT運(yùn)維壓力。

“云+AI+5G”引領(lǐng)基因產(chǎn)業(yè)智能化升級(jí)

在醫(yī)療健康行業(yè)智能升級(jí)的大背景下,基因測(cè)序也需要融合更多的新興技術(shù)手段來(lái)達(dá)到更高的精準(zhǔn)度和科學(xué)性,華為云將釋放“云+AI+5G”的強(qiáng)大動(dòng)能,讓測(cè)序企業(yè)更省、更快、更安心,實(shí)現(xiàn)行業(yè)的智能化升級(jí)。

云計(jì)算:打通線上線下形成容器混合云,容器鏡像自動(dòng)同步,資源、應(yīng)用統(tǒng)一管理運(yùn)維,使得線上線下功能和環(huán)境一致,用戶使用習(xí)慣一致。

大數(shù)據(jù):通過(guò)計(jì)算存儲(chǔ)分離、內(nèi)存及分布式緩存、智能調(diào)度,大數(shù)據(jù)性能提升40%,成本降低50%。

人工智能(AI):通過(guò)作業(yè)群組管理、拓?fù)涓兄挠H和性調(diào)度,GPU線性加速比提升35%,降低人工智能50%訓(xùn)練時(shí)間。

鯤鵬算力:整型計(jì)算+多核契合測(cè)序分析,Minimap2 軟件在鯤鵬920下性價(jià)比領(lǐng)先同代X86 20%。

在未來(lái)生物技術(shù)發(fā)展與云計(jì)算的共同推動(dòng)下,基因測(cè)序“黑科技”必然會(huì)造福更多的人類。也許有一天,現(xiàn)有的醫(yī)學(xué)疑難雜癥也會(huì)被一個(gè)個(gè)攻克。在這條生命科學(xué)的漫漫征程中,面向未來(lái),華為云將緊跟科技的發(fā)展和用戶需求的變化,持續(xù)進(jìn)行研發(fā)迭代升級(jí),伴隨基因產(chǎn)業(yè)一路前行!

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2019-12-31
華大基因與華為云的“智慧碰撞”,讓測(cè)序效率穩(wěn)步提升
支付幾百元將你的唾液郵寄,你的基因組序列就會(huì)得到分析,所得出的結(jié)果不僅可以診斷疾病,還可以用于未來(lái)疾病的風(fēng)險(xiǎn)預(yù)測(cè)。

長(zhǎng)按掃碼 閱讀全文