國(guó)內(nèi)首個(gè)二代基因測(cè)序FPGA加速方案落地騰訊云

伴隨著基因測(cè)序技術(shù)的快速發(fā)展,基因數(shù)據(jù)的生成呈現(xiàn)指數(shù)級(jí)增長(zhǎng),對(duì)分析能力提出更高要求。近日,騰訊云正式推出國(guó)內(nèi)首個(gè)基于自研FPGA極光技術(shù)的NGS加速方案,極大提升人類全基因組分析效率,有效改善基因領(lǐng)域數(shù)據(jù)分析速度慢、效率低等問(wèn)題。

騰訊云全面賦能改善基因領(lǐng)域難題

基因測(cè)序作為一種新型的基因檢測(cè)技術(shù),在生命科學(xué)研究中扮演著十分重要的角色,行業(yè)的蓬勃發(fā)展催生了生物基因數(shù)據(jù)爆炸式的增長(zhǎng),使得基因企業(yè)、科學(xué)工作者等面臨新的挑戰(zhàn)。日前,騰訊云表示將全面開(kāi)放各項(xiàng)IT能力,在傳輸、存儲(chǔ)、計(jì)算、管理和洞察等方面,助力生物基因領(lǐng)域全面快速發(fā)展。

首先,面對(duì)基因數(shù)據(jù)量的傳輸難題,騰訊云建成國(guó)內(nèi)最全的28線BGP網(wǎng)絡(luò)環(huán)境,使基因客戶快速穩(wěn)定地上傳和下載數(shù)據(jù),同時(shí)還能幫助基因企業(yè)客戶做數(shù)據(jù)上云,通過(guò)一鍵分發(fā)的功能讓基因企業(yè)將數(shù)據(jù)傳遞給科研用戶。其次,騰訊云通過(guò)提供文件存儲(chǔ)、對(duì)象存儲(chǔ)和歸檔存儲(chǔ)等存儲(chǔ)服務(wù),滿足基因領(lǐng)域客戶面對(duì)不同的數(shù)據(jù)使用場(chǎng)景和需求,而針對(duì)最核心的計(jì)算環(huán)節(jié),騰訊云提供超算云服務(wù),使科研工作者和基因企業(yè)能夠選擇多種高性能的虛擬機(jī)和物理機(jī)來(lái)加速基因計(jì)算。

除此之外,騰訊云為基因行業(yè)專門(mén)開(kāi)發(fā)了一體化的數(shù)據(jù)管理平臺(tái)“騰訊云雙螺旋PAAS平臺(tái)”,滿足基因用戶傳、存、算、管等需求。據(jù)了解,騰訊云雙螺旋平臺(tái)具有三大特點(diǎn)。首先是快速分析,通過(guò)在雙螺旋上使用FPGA來(lái)加速基因分析過(guò)程,對(duì)二代測(cè)序,已經(jīng)可以節(jié)省90%的時(shí)間,后續(xù)會(huì)繼續(xù)推出三代加速的服務(wù)。其次是節(jié)省費(fèi)用,依托雙螺旋的精準(zhǔn)調(diào)度能力,雙螺旋會(huì)在計(jì)算過(guò)程中按需調(diào)度最匹配的算力執(zhí)行任務(wù),避免出現(xiàn)CPU或內(nèi)存大量空跑情況。第三是人工智能技術(shù)的賦能,已在精準(zhǔn)醫(yī)療領(lǐng)域落地。例如,在廣東,AI騰訊覓影在幫助醫(yī)生做早期食道癌的篩查,對(duì)一張內(nèi)鏡檢查影響,覓影AI可以在4秒內(nèi)做出診斷,準(zhǔn)確率達(dá)到90%。

 

(圖注:騰訊雙螺旋PAAS平臺(tái)特點(diǎn)示意圖)

NGS加速方案,提升人類全基因組分析效率與分析準(zhǔn)確率

騰訊云基因團(tuán)隊(duì)近日推出的基于自研FPGA極光異構(gòu)系統(tǒng)的NGS加速方案,可將人類全基因組分析從30小時(shí)優(yōu)化到2.8小時(shí)。在實(shí)驗(yàn)過(guò)程中,研究人員采用一份30倍測(cè)序深度的人類全基因組FASTQ文件(NA12878),分別在業(yè)界常用的通用高性能服務(wù)器與搭載FPGA極光異構(gòu)系統(tǒng)的服務(wù)器上進(jìn)行了對(duì)比測(cè)試,實(shí)驗(yàn)數(shù)據(jù)表明,騰訊NGS加速方案加速比超過(guò)10倍。

 

(圖1:傳統(tǒng)計(jì)算系統(tǒng)與騰訊極光異構(gòu)系統(tǒng)對(duì)比)

據(jù)了解,傳統(tǒng)的計(jì)算系統(tǒng)通過(guò)采用多個(gè)高端CPU搭建HPC系統(tǒng)實(shí)現(xiàn)了縮短時(shí)間的目的,但這樣也使得成本增加,基因企業(yè)規(guī)模受限。而騰訊極光異構(gòu)系統(tǒng)在提供卓越性能的同時(shí),還能進(jìn)一步降低基因客戶的成本。它采用自研核心技術(shù)極光(Aurora Technology),通過(guò)以下三個(gè)方面整體優(yōu)化傳統(tǒng)的分析和計(jì)算流程。

第一,搭載BWA_MEM和Variant Calling專用硬件算法核。采用業(yè)界頂尖的大規(guī)模集成電路設(shè)計(jì)技術(shù),把算法性能提升了一個(gè)臺(tái)階。

第二,算法級(jí)優(yōu)化內(nèi)存訪問(wèn)的方式。

第三,IO瓶頸導(dǎo)致系統(tǒng)性能無(wú)法提升一直是基因二代分析流程的一大痛點(diǎn),通過(guò)系統(tǒng)和算法級(jí)別優(yōu)化以及異構(gòu)加速大幅降低IO帶寬需求。

 

(圖注:騰訊極光技術(shù)原理解析)

在極大提升分析效率的同時(shí),極光技術(shù)還保證了優(yōu)異的分析準(zhǔn)確率,與傳統(tǒng)軟件分析準(zhǔn)確率基本一致。研究人員將通用服務(wù)器和極光異構(gòu)系統(tǒng)上計(jì)算得出的分析結(jié)果,上傳PrecisionFD網(wǎng)站進(jìn)行比對(duì)。比對(duì)結(jié)果如下圖2和圖3所示:

 

(圖2:通用處理器測(cè)試結(jié)果)

 

(圖3:極光異構(gòu)系統(tǒng)測(cè)試結(jié)果)

滿足不同場(chǎng)景應(yīng)用需求,助力基因客戶商業(yè)成功

騰訊云依托在云計(jì)算、大數(shù)據(jù)、人工智能等領(lǐng)域的豐富經(jīng)驗(yàn)和積累,能夠滿足不同類型基因用戶的不同場(chǎng)景和模式需求的能力,使其生物基因生態(tài)解決方案已成為眾多生命科學(xué)領(lǐng)域用戶的優(yōu)先選擇。這其中就包括諾禾致源、碳云智能、格致基因等,騰訊云,正在以智能解決方案推動(dòng)著生命科學(xué)行業(yè)的發(fā)展。

致力于生命科學(xué)研究與人類健康領(lǐng)域的諾禾致源,利用騰訊超算云精準(zhǔn)匹配所需資源,滿足其在基礎(chǔ)科研、基因數(shù)據(jù)處理及臨床應(yīng)用等不同應(yīng)用場(chǎng)景和模式下對(duì)數(shù)據(jù)處理、存儲(chǔ)和傳輸?shù)膰?yán)苛要求,幫助科研和醫(yī)療人員更專注解決科學(xué)和臨床問(wèn)題。

碳云智能作為生命科學(xué)領(lǐng)域的創(chuàng)新公司,依托騰訊云在互聯(lián)網(wǎng)和人工智能等方面的優(yōu)勢(shì),以及彈性、高效、低延遲的在線計(jì)算和大數(shù)據(jù)處理領(lǐng)先能力,建立了一個(gè)包括生物樣本管理系統(tǒng)、分析計(jì)算系統(tǒng)、用戶數(shù)據(jù)管理系統(tǒng)等在內(nèi)的數(shù)字生命的大數(shù)據(jù)平臺(tái)。運(yùn)用人工智能技術(shù)分析、處理數(shù)據(jù)、尋找碳基生命的硅基未來(lái),幫助每一個(gè)人管理數(shù)字生命健康。

針對(duì)基因科學(xué)領(lǐng)域企業(yè)伙伴的不同量級(jí),騰訊云不斷推出高性價(jià)比產(chǎn)品滿足需求。格致基因合伙人黃柯表示,騰訊云提供的黑石實(shí)體結(jié)合虛擬機(jī)彈性計(jì)算的方案,很好地滿足了低成本高性能計(jì)算需求,在生命科學(xué)新領(lǐng)域提供高質(zhì)量服務(wù),為初創(chuàng)公司提供了良好的解決方案。

騰訊云一直致力于為客戶提供行業(yè)領(lǐng)先的解決方案,助力客戶解決所遇到的瓶頸。在基因科學(xué)領(lǐng)域,騰訊云表示未來(lái)將會(huì)推出更多服務(wù),進(jìn)一步降低基因客戶的成本和提升整體性能。據(jù)了解,騰訊云極光FPGA加速能力將通過(guò)雙螺旋產(chǎn)品進(jìn)行開(kāi)放,目前已開(kāi)放體驗(yàn)測(cè)試預(yù)約,提前預(yù)約,先人一步體驗(yàn),享受更多優(yōu)惠。


極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2017-12-22
國(guó)內(nèi)首個(gè)二代基因測(cè)序FPGA加速方案落地騰訊云
伴隨著基因測(cè)序技術(shù)的快速發(fā)展,基因數(shù)據(jù)的生成呈現(xiàn)指數(shù)級(jí)增長(zhǎng),對(duì)分析能力提出更高要求。近日,騰訊云正式推出國(guó)內(nèi)首個(gè)基于自研FPGA極光技術(shù)的NGS加速方案,極大提升人類全基因組分析效率,有效改善基因領(lǐng)域數(shù)據(jù)分析速度慢、效率低等問(wèn)題。騰訊云全面賦能改善基因領(lǐng)域難題基因測(cè)序作

長(zhǎng)按掃碼 閱讀全文