近日,ChatGPT和文心一言等超大規(guī)模預(yù)訓(xùn)練模型紛紛登場,讓我們看到了AI破解人類自然語言的力量。
成立兩年多以來,BioMap百圖生科一直致力于打造生命科學(xué)領(lǐng)域的AI大模型,構(gòu)建了千億參數(shù)的跨模態(tài)大模型“xTrimo” (The Cross-Modal Transformer Representation of Interactome and Multi-Omics)。
該大模型從跨物種、跨模態(tài)的生命信息中學(xué)習(xí)蛋白質(zhì)如何構(gòu)成和實(shí)現(xiàn)功能、如何相互作用、如何組合和調(diào)控細(xì)胞功能的關(guān)鍵規(guī)律,從而破解生命的自然語言 —— 蛋白質(zhì)?;诖竽P?AI在一系列任務(wù)算法上取得了明顯的進(jìn)展,除了更好地完成結(jié)構(gòu)預(yù)測(cè)等基礎(chǔ)任務(wù)外,也開始可以根據(jù)不同的問題輸入,以生成的方式,設(shè)計(jì)創(chuàng)新的蛋白質(zhì),來回答各種生命科學(xué)問題。
2023年3月23日,百圖生科在北京發(fā)布生命科學(xué)大模型驅(qū)動(dòng)的AIGP —— AIGeneratedProtein平臺(tái),旨在將這一技術(shù)平臺(tái)的能力與更多行業(yè)伙伴分享,利用AI設(shè)計(jì)創(chuàng)新蛋白質(zhì)的能力,共同研發(fā)更多的前沿藥物和其他生命科學(xué)項(xiàng)目,也通過一系列挑戰(zhàn)性的新任務(wù),驅(qū)動(dòng)AIGP平臺(tái)的技術(shù)進(jìn)步。
在發(fā)布前,AIGP平臺(tái)已經(jīng)進(jìn)行了一段時(shí)間的內(nèi)部測(cè)試,在百圖生科內(nèi)部承載了其創(chuàng)新免疫調(diào)控藥物ImmuBot的研發(fā)工作,貢獻(xiàn)了多個(gè)高性能彈頭、新功能傳感器的研發(fā)案例。
除此之外,有近20家合作伙伴和百圖生科開展了AIGP聯(lián)合研發(fā)合作,方向覆蓋高性能彈頭設(shè)計(jì)、新功能蛋白質(zhì)設(shè)計(jì)、靶點(diǎn)挖掘和調(diào)控蛋白設(shè)計(jì)等領(lǐng)域,其中多個(gè)項(xiàng)目取得了階段性的發(fā)現(xiàn)成果。在合作的創(chuàng)新藥企、學(xué)術(shù)PI的幫助下,AIGP平臺(tái)也進(jìn)行了諸多優(yōu)化。
因此,本次百圖生科AIGP平臺(tái)的對(duì)外發(fā)布,實(shí)際意味著對(duì)平臺(tái)創(chuàng)新蛋白質(zhì)的生成能力開啟“公測(cè)”新階段,也意味著百圖生科AIGP平臺(tái)將為更多伙伴,包括科研、環(huán)保、材料、消費(fèi)等更多場景的需求,提供解決方案。
圖: AIGP 3大功能模塊+12項(xiàng)核心能力示意圖
目前,百圖生科AIGP平臺(tái)設(shè)置了3類功能模塊,分別是Function to Protein Design(F2P,根據(jù)結(jié)構(gòu)、功能、可開發(fā)性等功能指標(biāo)設(shè)計(jì)/優(yōu)化蛋白質(zhì))、Protein to Protein Design(P2P,給定抗原等目標(biāo)蛋白,設(shè)計(jì)與之以特定方式結(jié)合的抗體等蛋白),以及Cell to Protein Design(C2P,給定細(xì)胞,發(fā)現(xiàn)調(diào)控細(xì)胞功能的靶點(diǎn)蛋白并設(shè)計(jì)相應(yīng)的調(diào)控蛋白)。
根據(jù)不同模塊的輸入和要求,AIGP平臺(tái)可在較短時(shí)間內(nèi)設(shè)計(jì)和生成具有特定性質(zhì)的蛋白質(zhì)。
隨著面向合作伙伴的公測(cè)階段取得進(jìn)展,百圖生科計(jì)劃于2023年6月起將部分功能模塊進(jìn)一步開放,讓專業(yè)用戶可以直接自主使用,在更多的研究場景調(diào)用AI的蛋白質(zhì)生成能力,激發(fā)更多的生命科學(xué)探索。
對(duì)于百圖生科AIGP平臺(tái)的發(fā)布,世界生物信息學(xué)界的著名學(xué)者、哈佛計(jì)算生物醫(yī)學(xué)中心創(chuàng)始主任、R語言的主要發(fā)明人、百圖生科科學(xué)顧問委員會(huì)委員Robert Gentleman教授表示,在哈佛,他的團(tuán)隊(duì)同樣在進(jìn)行蛋白質(zhì)生成/預(yù)測(cè)模型的相關(guān)研究,“百圖生科在這個(gè)方向上走得很遠(yuǎn)了”。
他期待,AIGP會(huì)帶來更多的蛋白質(zhì)/抗體生成模型,抗體工程師們可能會(huì)從這些模型的預(yù)測(cè)中,發(fā)現(xiàn)自己從未注意過的細(xì)節(jié),“如果將這些模型視作‘ideagenerator’,一切會(huì)變得更加美妙”。
中國科學(xué)院院士、著名免疫學(xué)家董晨教授認(rèn)為:“AI能夠解決的問題,就是對(duì)大數(shù)據(jù)的分析和進(jìn)一步的演繹和應(yīng)用。在當(dāng)下的時(shí)間節(jié)點(diǎn),AIGP確實(shí)是一個(gè)呼之欲出的平臺(tái)。相信AIGP對(duì)于我們理解蛋白質(zhì),以及在生物系統(tǒng)中研究和發(fā)現(xiàn)它的功能和調(diào)控,乃至于將來研發(fā)新藥,都會(huì)有非常大的作用。”
圖: 百圖生科CTO 宋樂博士
從AIGC到AIGP,人工智能的生成和預(yù)測(cè)能力對(duì)真實(shí)世界的影響將進(jìn)一步加深。
而AIGP能力的背后,正是百圖生科在底層技術(shù)上的持續(xù)投入,以及與合作伙伴對(duì)前沿創(chuàng)新的共同追求。發(fā)布會(huì)上,百圖生科CTO宋樂博士對(duì)此進(jìn)行了詳細(xì)介紹。
此前的媒體采訪中,宋樂博士也表示:“因?yàn)樯w的高度復(fù)雜度。目前數(shù)據(jù)量很大,但仍然是有限的。隨著生命科學(xué)領(lǐng)域觀測(cè)手段和技術(shù)的發(fā)展,將使我們能夠更加精細(xì)精準(zhǔn)地理解進(jìn)化,理解生命。這也就意味著,要實(shí)現(xiàn)這一目標(biāo),我們需要不斷吸納新的合作伙伴。”
正如百圖生科CEO劉維在本次發(fā)布活動(dòng)所提到的,雖然百圖生科的AI大模型和與之配套的大規(guī)模數(shù)據(jù)圖譜、高通量驗(yàn)證體系都遠(yuǎn)不完美,但已經(jīng)凝結(jié)了很多前沿技術(shù)的創(chuàng)新和探索,接下來,從開始展露一些能力到提高它的泛化能力和速度,需要專業(yè)伙伴的合作的加入,而且,合作伙伴也將得益這一系列嘗試,實(shí)現(xiàn)前沿項(xiàng)目的加速研發(fā)。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )