深度學習給生物學帶來了哪些改變?(上)

高層速讀

關鍵信息:生物學研究人員正在使用深度學習算法對細胞圖像進行分類、建立基因組聯(lián)系、推進藥物發(fā)現(xiàn)…從基因組學、成像到電子病歷均有深度學習的應用。

人工智能作為一種流行的科技,為生物數(shù)據(jù)的測量和分類提供了強有力的幫助,但是對于那些對人工智能不熟悉的人來說,這項技術是困難的。

谷歌團隊與神經(jīng)學家的合作

四年前,谷歌的科學家們出現(xiàn)在了神經(jīng)學家 Steve Finkbeiner的家門口,這些科學家是位于加州山景城的谷歌加速科學研究部門的人員,該部門的目標是利用谷歌人工智能技術來加速科學發(fā)展,他們有興趣將深度學習技術應用于神經(jīng)疾病研究,比如與擁有大量神經(jīng)成像數(shù)據(jù)的Finkbeiner團隊合作。

在神經(jīng)成像數(shù)據(jù)中,深度學習算法從一個非常大的、帶注釋的數(shù)據(jù)集(如圖像或基因組集合)中獲取數(shù)據(jù)的原始特征,并利用它們創(chuàng)建一個數(shù)據(jù)預測模型,一旦經(jīng)過訓練,這些算法就可以應用這種訓練來分析其他數(shù)據(jù)。

Finkbeiner說,這項技術可以用來解決“真正困難、棘手、復雜的問題,并能看到數(shù)據(jù)中的結構的不足:數(shù)據(jù)量太大、太復雜、人腦無法理解等。”

Finkbeiner和他的團隊使用一種高通量成像策略來獲取數(shù)據(jù),這種策略是他們?yōu)檠芯磕X細胞而開發(fā)的。但團隊的數(shù)據(jù)分析速度卻遠不如獲取速度那樣快,因此Finkbeiner同意了與谷歌團隊的合作。

深度學習給生物學帶來了哪些改變?(上)

在達成合作之后,F(xiàn)inkbeiner坦然地說道:“我當時可不能實話實說,雖然我知道深度學習可以解決哪些問題,但我也清楚,我們數(shù)據(jù)分析能力只有數(shù)據(jù)獲取能力的一半左右,我們團隊的數(shù)據(jù)分析能力還是比較弱?!?/p>

二者深度學習算法初見成效

現(xiàn)在,二者的合作和努力開始收到成效。Finkbeiner的團隊和谷歌的科學家一起,訓練了一套由兩組細胞組成的深度學習算法。其中一組是未標記的,另一組是人工標記的,用來表示科學家通常觀察不到的數(shù)據(jù)特征。

Finkbeiner說,當他們后來將該算法運用在未貼標簽的細胞圖像上時,團隊驚訝地發(fā)現(xiàn),“該算法在預測圖像該貼什么標簽方面非常出色”,并且有一份詳細說明這一工作的刊物即將出版。

Finkbeiner的成功凸顯了人工智能最有希望的分支之一--深度學習--正在生物學領域取得進展,這些算法已經(jīng)滲透到智能手機、智能音箱和自動駕駛汽車等領域中。在生物學中,深度學習算法以人類無法理解的方式深入數(shù)據(jù),檢測到人類可能無法捕捉到的生物特征。

深度學習給生物學帶來了哪些改變?(上)

研究人員正在使用這些算法對細胞圖像進行分類,建立基因組聯(lián)系,推進藥物發(fā)現(xiàn),甚至發(fā)現(xiàn)不同數(shù)據(jù)類型之間的聯(lián)系,從基因組學、成像到電子病歷領域均有應用。

訓練智能算法做出預測

深度學習算法是20世紀40年代首次提出的一種計算模型,它依賴于神經(jīng)網(wǎng)絡。在該模型中,類似神經(jīng)元的節(jié)點層模仿人類大腦分析信息的方式。賓夕法尼亞大學費城分校的計算生物學家Casey Greene說,直到五年前,基于神經(jīng)網(wǎng)絡的機器學習算法還依賴于研究人員將原始信息處理成一種更有意義的形式,然后將其輸入計算模型。

深度學習給生物學帶來了哪些改變?(上)

但是,數(shù)據(jù)集規(guī)模的爆炸式增長--比如智能手機快照或大規(guī)?;蚪M測序--以及算法創(chuàng)新等,已經(jīng)使人類的數(shù)據(jù)處理能力后退一步成為可能。機器學習的“深度學習”這一進步,迫使計算機找到嵌入像素中有意義的關系。作為神經(jīng)網(wǎng)絡過濾和信息排序的層,它們還相互通信,允許每一層優(yōu)化前一層的輸出。

最終,這個過程允許一個經(jīng)過訓練的算法來分析一幅新的圖像,并能正確地識別它,例如某一個病患的細胞。但是,算法無法再控制分類過程,甚至無法精確解釋軟件正在做什么。盡管這些深度學習網(wǎng)絡在做出預測方面可以驚人地準確,但finkbeiner說,“有時候要弄清楚網(wǎng)絡看是因為到了什么才能做出如此準確的預測仍然是一項挑戰(zhàn)”。

生物學的其他分支也獲得回報

然而,生物學的許多分支學科如成像等,正在從這些預測中獲得回報。例如,2005年,麻省理工學院和哈佛大學的計算生物學家Anne Carpenter發(fā)布了一個名為Cell Profiler的開源軟件包,以幫助生物學家定量測量個體特征。例如:顯微鏡領域中熒光細胞的數(shù)量或斑馬魚的長度。

但是深度學習可以讓Carpenter的團隊走得更遠。她說:“我們已經(jīng)轉向測量生物學家們沒有意識到的可以用圖像來測量的東西?!庇涗洸⒔Y合像DNA染色、細胞器紋理和細胞中空空間的質量等視覺特征,可以產(chǎn)生數(shù)千個數(shù)據(jù)特征,其中任何一個特征都有可能揭示新發(fā)現(xiàn)。目前版本的Cell Profiler包含了一些深度學習的元素,她的團隊希望在明年增加更復雜的深度學習工具。

Carpenter說:“大多數(shù)人都很難做到,但事實上,在一張細胞圖像中存在很多信息,就像對細胞群進行轉錄分析時的信息一樣多?!?/p>

深度學習給生物學帶來了哪些改變?(上)

這種處理方式使Carpenter的團隊能夠采取一種監(jiān)管較少的方法,將細胞圖像轉換為與疾病相關的表型。Carpenter還是Recursion制藥公司的科學顧問,該公司正利用其深度學習工具,針對罕見的單基因疾病進行藥物開發(fā)。

微信搜索【AI商業(yè)報道】,獲取最新行業(yè)資訊!

免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產(chǎn)權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

2018-03-05
深度學習給生物學帶來了哪些改變?(上)
高層速讀關鍵信息:生物學研究人員正在使用深度學習算法對細胞圖像進行分類、建立基因組聯(lián)系、推進藥物發(fā)現(xiàn)…

長按掃碼 閱讀全文