華為云發(fā)布新冠AI科研知識(shí)圖譜,為科技抗疫提速

近期,華為云EI醫(yī)療智能體(EIHealth)采用自研醫(yī)學(xué)領(lǐng)域AI模型和知識(shí)圖譜技術(shù),從公開(kāi)發(fā)表的新冠學(xué)術(shù)文獻(xiàn)中快速構(gòu)建新冠AI科研知識(shí)圖譜,協(xié)助科研人員更快速、有效的開(kāi)展抗疫科學(xué)研究和藥物研發(fā)。

2020年初爆發(fā)的新型冠狀病毒(SARS-CoV-2)是一種全新的病毒,由于科學(xué)家對(duì)它的致病機(jī)制和傳播機(jī)制并不了解,給疾病的防御和治療帶來(lái)了巨大的挑戰(zhàn)。隨著各國(guó)研究人員不斷的從臨床研究、實(shí)驗(yàn)室中收集針對(duì)SARS-CoV-2的研究數(shù)據(jù),短時(shí)間內(nèi)大量的科研成果發(fā)表在科研期刊上。迄今為止,在主流的醫(yī)學(xué)預(yù)印本文獻(xiàn)庫(kù)中,新冠病毒相關(guān)的學(xué)術(shù)文獻(xiàn)已經(jīng)達(dá)到了兩千多篇。

為了能夠更有效的幫助科研工作者在海量的新冠病毒相關(guān)文獻(xiàn)中總結(jié)、查詢(xún)、推理有效的知識(shí),華為云使用ModelArtsPro知識(shí)圖譜套件,從公開(kāi)發(fā)表的新冠學(xué)術(shù)文獻(xiàn)中,自動(dòng)抽取相應(yīng)實(shí)體和關(guān)系,并構(gòu)建了首個(gè)包含藥物、疾病、病毒蛋白、人類(lèi)蛋白等不同類(lèi)型實(shí)體的新冠科研知識(shí)圖譜。

華為云發(fā)布新冠AI科研知識(shí)圖譜,為科技抗疫提速

華為云發(fā)布新冠AI科研知識(shí)圖譜,為科技抗疫提速

這項(xiàng)工作的一大難點(diǎn),是如何實(shí)現(xiàn)高精度的領(lǐng)域命名實(shí)體識(shí)別和關(guān)系抽取,比如上圖中句子里提到的相關(guān)病毒蛋白(Virus Protein)、 人類(lèi)蛋白(HumanProtein)、病毒(Virus)以及從上下文判別出的相互關(guān)系。研發(fā)團(tuán)隊(duì)采用了華為諾亞方舟實(shí)驗(yàn)室和華為云最新研究成果醫(yī)學(xué)領(lǐng)域知識(shí)監(jiān)督的預(yù)訓(xùn)練語(yǔ)言模型:BERT-MK (BERT-based language model with Medical Knowledge) ,并融合了團(tuán)隊(duì)在知識(shí)挖掘領(lǐng)域積累的多項(xiàng)深度語(yǔ)義表示和檢索技術(shù)。值得一提的是,在此前的科學(xué)文獻(xiàn)挖掘領(lǐng)域相關(guān)賽事上,華為云語(yǔ)音語(yǔ)義創(chuàng)新Lab已多次奪冠,包括DigSci 2019和WSDM Cup 2020

華為云發(fā)布新冠AI科研知識(shí)圖譜,為科技抗疫提速

華為云同時(shí)提供了個(gè)性化的查詢(xún)可視化工具,可清晰直接地展現(xiàn)新冠科研知識(shí)圖譜內(nèi)的知識(shí)點(diǎn)及其關(guān)聯(lián),并且能夠快速溯源知識(shí)信息的來(lái)源,直接定位相關(guān)的文獻(xiàn)及知識(shí)所在段落。例如:查詢(xún)藥物L(fēng)opinavir,可發(fā)現(xiàn)Lopinavir對(duì)于SARS-CoV-2的Mpro以及HIV protease均有一定的效果。通過(guò)進(jìn)一步探索,可發(fā)現(xiàn)Colistin和Nelfinavir對(duì)SARS-CoV-2的Mpro也有一定效果。通過(guò)查看具體關(guān)系,又可進(jìn)一步獲取該關(guān)系來(lái)源的文獻(xiàn)及段落信息等,直接溯源原始信息。該圖譜可協(xié)助科研人員快速、高效地開(kāi)展病毒機(jī)制研究、病毒蛋白相互作用等科學(xué)研究,協(xié)助藥物研發(fā)人員更加精確、有效地開(kāi)展藥物靶點(diǎn)研究、疫苗開(kāi)發(fā)等藥物研發(fā)工作。

在抗疫期間,華為云和浙江大學(xué)陳華鈞教授合作,已在OpenKG發(fā)布包括新冠病毒分類(lèi)圖譜、抗病毒藥物圖譜等多種類(lèi)型的新冠科研知識(shí)圖譜。同時(shí),華為云EI醫(yī)療智能體(EIHealth)和醫(yī)療領(lǐng)域的科研工作者共同奮斗在一線,相繼推出了一系列的抗病毒基因組服務(wù)、醫(yī)療影像服務(wù)和抗病毒藥物篩選服務(wù),全面、立體的助力全球科研人員的研發(fā)工作。

更多內(nèi)容請(qǐng)?jiān)L問(wèn)華為云EI醫(yī)療智能體(EIHealth)官網(wǎng)。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )