GAN深度學(xué)習(xí)模型之父:一個(gè)給予了機(jī)器想象力的男人

高層速讀

關(guān)鍵信息:通過(guò)將兩種神經(jīng)網(wǎng)絡(luò)進(jìn)行相互對(duì)立,Ian Goodfellow(伊恩·古德費(fèi)羅)創(chuàng)造了一個(gè)強(qiáng)大的人工智能工具——生成式對(duì)抗網(wǎng)絡(luò)(GAN)。GAN在生成模型和判別模型的互相博弈學(xué)習(xí)產(chǎn)生好的輸出,能夠給予機(jī)器想象、創(chuàng)造的東西,具有一定的自主意識(shí)。

關(guān)鍵意義:GAN是人工智能中所謂“無(wú)監(jiān)督學(xué)習(xí)”的一大步,更能夠使機(jī)器更少地依賴(lài)人類(lèi)來(lái)幫助它們了解這個(gè)世界。

| 關(guān)于生成式對(duì)抗網(wǎng)絡(luò)(Generative Adversarial Net)

近年來(lái),深度學(xué)習(xí)技術(shù)被廣泛應(yīng)用于各類(lèi)數(shù)據(jù)處理任務(wù)中,比如圖像、語(yǔ)音和文本。而生成式對(duì)抗網(wǎng)絡(luò)(GAN)是一種深度學(xué)習(xí)模型,也是無(wú)監(jiān)督學(xué)習(xí)最具前景的方法之一。GAN通過(guò)框架中(至少)兩個(gè)模塊:生成模型(Generative Model)和判別模型(Discriminative Model)的互相博弈學(xué)習(xí)產(chǎn)生好的輸出。

GAN深度學(xué)習(xí)模型:讓機(jī)器學(xué)會(huì)創(chuàng)造

2014的一天晚上, Goodfellow和他剛畢業(yè)的博士同學(xué)們一起喝酒慶祝,在蒙特利爾最受歡迎的酒吧Les 3 Brasseur,當(dāng)時(shí)一些朋友想讓他幫忙做一個(gè)非常棘手的項(xiàng)目:一個(gè)可以自己制作照片的電腦程序。

當(dāng)時(shí)研究人員已經(jīng)在使用神經(jīng)網(wǎng)絡(luò)作為對(duì)策,這種算法以人腦中的神經(jīng)元網(wǎng)絡(luò)作為生成模型,用以創(chuàng)造合理的新數(shù)據(jù)。但結(jié)果往往不是很好:計(jì)算機(jī)生成的臉往往很模糊,或者有錯(cuò)誤,如缺少耳朵等。 Goodfellow的朋友們提出的改進(jìn)是對(duì)構(gòu)成照片的元素進(jìn)行復(fù)雜的統(tǒng)計(jì)分析,以幫助機(jī)器自行生成圖像。然而這將需要大量的數(shù)據(jù)和運(yùn)算, Goodfellow告訴他們這根本行不通。

但是,當(dāng)他在喝著啤酒思考這個(gè)問(wèn)題時(shí),他想到了一個(gè)主意:如果讓兩個(gè)神經(jīng)網(wǎng)絡(luò)互相對(duì)抗呢?他的朋友們對(duì)此持懷疑態(tài)度,但他決定試一試。Goodfellow在家中寫(xiě)代碼一直到凌晨,然后測(cè)試了他做寫(xiě)的軟件,第一次成功了。

GAN深度學(xué)習(xí)模型之父:一個(gè)給予了機(jī)器想象力的男人

▲Goodfellow

Goodfellow那晚發(fā)明的東西現(xiàn)在被稱(chēng)為“GAN”,也叫“生成式對(duì)抗網(wǎng)絡(luò)”,可應(yīng)用在NPL(自然語(yǔ)言處理)等技術(shù)領(lǐng)域。這項(xiàng)技術(shù)在機(jī)器學(xué)習(xí)領(lǐng)域引發(fā)了巨大影響,其創(chuàng)作者也變成了人工智能領(lǐng)域的重要人物。

在過(guò)去的幾年里,人工智能研究人員利用一種叫做深度學(xué)習(xí)的技術(shù)取得了令人興奮的進(jìn)展。例如提供一個(gè)有足夠圖像數(shù)據(jù)的深度學(xué)習(xí)系統(tǒng),它可以識(shí)別出即將過(guò)馬路的行人。深度學(xué)習(xí)技術(shù)使得自動(dòng)駕駛汽車(chē)和為Alexa、Siri等虛擬助手提供動(dòng)力的人機(jī)對(duì)話(huà)成為可能。

但是,盡管深度學(xué)習(xí)的人工智能可以學(xué)會(huì)識(shí)別事物,但他們并不擅長(zhǎng)創(chuàng)造事物。而GAN的目標(biāo)是給機(jī)器一些類(lèi)似于想象、創(chuàng)造的東西。

GAN深度學(xué)習(xí)模型之父:一個(gè)給予了機(jī)器想象力的男人

讓機(jī)器進(jìn)行創(chuàng)造不僅能使他們進(jìn)行繪畫(huà)或作曲,更重要的是,這能使它們更少地依賴(lài)人類(lèi)來(lái)幫助它們了解這個(gè)世界和其運(yùn)作方式。今天,人工智能程序員經(jīng)常需要告訴機(jī)器所提供的訓(xùn)練數(shù)據(jù)是什么,比如在一百萬(wàn)張圖片中,哪一張包含行人橫過(guò)馬路,哪些沒(méi)有。這不僅數(shù)據(jù)和人力成本高,而且限制了機(jī)器系統(tǒng)處理的能力,即使是輕微的偏離數(shù)據(jù)的訓(xùn)練。在未來(lái),計(jì)算機(jī)將在不被告知的情況下更好地利用原始數(shù)據(jù)并計(jì)算出他們需要從中學(xué)習(xí)的東西。

GAN深度學(xué)習(xí)模型之父:一個(gè)給予了機(jī)器想象力的男人

▲微軟推出的“看圖作畫(huà)”機(jī)器人

這是人工智能中所謂“無(wú)監(jiān)督學(xué)習(xí)”的一大步。譬如,一輛自動(dòng)駕駛汽車(chē)可以在不離開(kāi)車(chē)庫(kù)的情況下自學(xué)到許多不同的道路條件;機(jī)器人可以預(yù)見(jiàn)它在繁忙的倉(cāng)庫(kù)中可能遇到的障礙,而不需要帶著它去倉(cāng)庫(kù)中體驗(yàn)。

我們擁有想象和思考許多不同情景的能力是我們成為人類(lèi)的原因之一。當(dāng)未來(lái)的技術(shù)歷史學(xué)家回顧過(guò)去時(shí),他們可能會(huì)認(rèn)為GAN是朝著創(chuàng)造具有人類(lèi)意識(shí)的機(jī)器邁出的一大步。Facebook首席人工智能科學(xué)家Yann LeCun稱(chēng)GANs是“過(guò)去20年來(lái)深度學(xué)習(xí)中最酷的想法”。另一位人工智能名人、中國(guó)百度前首席科學(xué)家吳恩達(dá)(AndrewNg)也表示,GAN代表著“一項(xiàng)重大而根本性的進(jìn)步”,這激發(fā)了越來(lái)越多的全球研究人員投入到深度學(xué)習(xí)研發(fā)之中。

生成式對(duì)抗網(wǎng)絡(luò)要“對(duì)抗”多種因素

Goodfellow現(xiàn)在是谷歌大腦團(tuán)隊(duì)的一名科學(xué)家,該公司位于加州山景城的總部。當(dāng)記者在那里遇見(jiàn)他時(shí),他仍然對(duì)人工智能名人身份感到驚訝,稱(chēng)這是“有點(diǎn)超現(xiàn)實(shí)”。同樣令人驚訝的是,他已經(jīng)發(fā)現(xiàn)了有人正在利用GAN達(dá)到不法目的,現(xiàn)在他的大部分時(shí)間都花在這方面。

GAN深度學(xué)習(xí)模型之父:一個(gè)給予了機(jī)器想象力的男人

GAN的特點(diǎn)在于兩個(gè)神經(jīng)網(wǎng)絡(luò)之間的對(duì)抗。第一個(gè)被稱(chēng)為生成器,負(fù)責(zé)輸出盡可能逼真的素材,如照片或手寫(xiě)稿。第二個(gè)被稱(chēng)為鑒別器,它將這些圖像與原始數(shù)據(jù)集中的真實(shí)圖像進(jìn)行比較,并試圖確定哪些是真實(shí)的,哪些是假的。在這些結(jié)果的基礎(chǔ)上,生成器再調(diào)整其參數(shù)以創(chuàng)建新的圖像。如此循環(huán),直到鑒別器不能再分辨出真假。

GAN深度學(xué)習(xí)模型之父:一個(gè)給予了機(jī)器想象力的男人

在去年一個(gè)公開(kāi)的例子中,芯片公司英偉達(dá)的研究人員對(duì)GAN進(jìn)行了培訓(xùn),通過(guò)研究真實(shí)的照片來(lái)生成虛擬名人的照片。雖然并不是所有的「假明星」都是完美的,但與其他需要數(shù)萬(wàn)張訓(xùn)練圖像的機(jī)器學(xué)習(xí)方法相比,GAN可以精通幾百?gòu)垐D像。

原始訓(xùn)練數(shù)據(jù)的質(zhì)量對(duì)訓(xùn)練效果也有很大的影響。在一個(gè)例子中,GAN開(kāi)始制作帶有隨機(jī)字母的貓圖片。因?yàn)橛?xùn)練數(shù)據(jù)中包含了來(lái)自互聯(lián)網(wǎng)的貓模因(模因即在生物進(jìn)化中與基因作用類(lèi)似的事物),所以機(jī)器已經(jīng)告訴自己,字母是它作為一只貓的含義的一部分。

華盛頓大學(xué)的機(jī)器學(xué)習(xí)研究人員Pedro Domingos說(shuō)道,GAN是個(gè)性情暴躁的AI。如果鑒別器太容易欺騙,生成器輸出將看上去不真實(shí)。而校準(zhǔn)兩個(gè)對(duì)抗的神經(jīng)網(wǎng)絡(luò)可能很困難,這就解釋了為什么GAN有時(shí)會(huì)輸出奇怪的東西,比如有兩個(gè)頭的動(dòng)物。

GAN深度學(xué)習(xí)模型之父:一個(gè)給予了機(jī)器想象力的男人

▲GAN輸出的假照片

然而,這些挑戰(zhàn)并沒(méi)有阻止研究人員。自從 Goodfellow和其他幾個(gè)人在2014發(fā)表了關(guān)于他發(fā)現(xiàn)的第一份研究報(bào)告以來(lái),已經(jīng)有了數(shù)百篇與GAN有關(guān)的論文。這項(xiàng)技術(shù)的一位粉絲甚至創(chuàng)建了一個(gè)名為“GAN Zoo”的網(wǎng)頁(yè),致力于跟蹤已經(jīng)開(kāi)發(fā)出來(lái)的各種技術(shù)版本。

GAN深度學(xué)習(xí)模型最明顯的即時(shí)應(yīng)用是在涉及大量圖像的領(lǐng)域,如電子游戲和時(shí)尚領(lǐng)域。但展望未來(lái), Goodfellow認(rèn)為GAN將推動(dòng)更大的進(jìn)步。他說(shuō):“科學(xué)和工程領(lǐng)域有很多方面需要優(yōu)化,”他舉例說(shuō),比如需要更有效的藥物或必須提高電池的效率。“這將是下一波巨浪?!?/p>

在高能物理中,科學(xué)家們使用強(qiáng)大的計(jì)算機(jī)來(lái)模擬數(shù)百個(gè)微粒像瑞士核研究中心大型粒子對(duì)撞機(jī)這樣的機(jī)器中可能發(fā)生的相互作用。這些模擬速度慢,需要大量的計(jì)算力。耶魯大學(xué)和勞倫斯伯克利國(guó)家實(shí)驗(yàn)室的研究人員開(kāi)發(fā)了一種GAN,在對(duì)現(xiàn)有的模擬數(shù)據(jù)進(jìn)行訓(xùn)練之后,GAN學(xué)會(huì)了準(zhǔn)確地預(yù)測(cè)某一粒子的行為,并使其運(yùn)行得更快。

GAN深度學(xué)習(xí)模型之父:一個(gè)給予了機(jī)器想象力的男人

醫(yī)學(xué)研究是深度學(xué)習(xí)另一個(gè)有前途的領(lǐng)域,隱私問(wèn)題的存在意味著研究人員有時(shí)無(wú)法獲得足夠的真實(shí)病人數(shù)據(jù),比如分析藥物無(wú)效的數(shù)據(jù)。賓夕法尼亞大學(xué)的CaseyGreene說(shuō),GAN可以通過(guò)生成幾乎和真實(shí)記錄一樣好的假記錄來(lái)幫助解決這個(gè)問(wèn)題。這些數(shù)據(jù)可以更廣泛地共享和研究,而真正的記錄則受到嚴(yán)格保護(hù)。

GAN之父:技術(shù)進(jìn)步不能缺少負(fù)面因素

然而,技術(shù)有黑暗的一面。一臺(tái)用來(lái)制造「真實(shí)假貨」的機(jī)器,對(duì)于那些想要影響股票價(jià)格、選舉等假新聞的提供者來(lái)說(shuō),是一個(gè)完美的武器。況且,人工智能已經(jīng)被用來(lái)在色情片的身體上放別人臉的照片,以及在政客的嘴上放上文字。GAN雖沒(méi)有制造這個(gè)問(wèn)題,但GAN的存在確實(shí)會(huì)讓問(wèn)題更糟。

哈尼·法里德(Hany Farid)是達(dá)特茅斯學(xué)院(DartmouthCollege)的數(shù)字取證專(zhuān)業(yè)畢業(yè)生,目前他正在研究更有效的識(shí)別假視頻的方法,比如檢測(cè)吸入和呼氣引起的面部顏色的細(xì)微變化,這種方法是有效的,因?yàn)镚AN發(fā)現(xiàn)這些變化很難精確模仿。但Hany Farid警告說(shuō),GAN會(huì)反過(guò)來(lái)適應(yīng),“我們從根本上說(shuō)處于弱勢(shì)?!?/strong>

GAN深度學(xué)習(xí)模型之父:一個(gè)給予了機(jī)器想象力的男人

這種「貓捉老鼠」的游戲也將在網(wǎng)絡(luò)安全中發(fā)揮作用。研究人員已經(jīng)強(qiáng)調(diào)了“黑匣子”攻擊的風(fēng)險(xiǎn),在這種攻擊中,GAN被用來(lái)找出機(jī)器學(xué)習(xí)模型,因?yàn)樵S多安全程序都用這些模型來(lái)發(fā)現(xiàn)惡意軟件。但是,在預(yù)測(cè)了防御算法的工作原理之后,攻擊者可以避開(kāi)它并插入流氓代碼。

現(xiàn)在, Goodfellow領(lǐng)導(dǎo)著谷歌的一個(gè)團(tuán)隊(duì),專(zhuān)注于讓機(jī)器學(xué)習(xí)更加安全。他警告說(shuō),人工智能社區(qū)必須吸取以往創(chuàng)新浪潮的教訓(xùn),在創(chuàng)新浪潮中,技術(shù)人員將安全和隱私視為事后考慮。當(dāng)他們意識(shí)到風(fēng)險(xiǎn)的時(shí)候,壞人已經(jīng)有了明顯的領(lǐng)先優(yōu)勢(shì)?!昂苊黠@,我們已經(jīng)開(kāi)始了,”他說(shuō),“但希望我們能在安全方面取得重大進(jìn)展,否則我們就會(huì)離我們的出發(fā)點(diǎn)越走越遠(yuǎn)?!?/p>

GAN深度學(xué)習(xí)模型之父:一個(gè)給予了機(jī)器想象力的男人

盡管如此, Goodfellow認(rèn)為將不存在一個(gè)純粹沒(méi)有任何欺騙的技術(shù)解決方案。相反,他認(rèn)為,技術(shù)依賴(lài)于各種社會(huì)因素而進(jìn)步。比如教孩子們批判性思維,讓他們參加演講和辯論課。他說(shuō):“在演講和辯論中,你會(huì)和另一個(gè)學(xué)生競(jìng)爭(zhēng),你在考慮如何編造有利于自己甚至是誤導(dǎo)的說(shuō)法,或者如何編造出非常有說(shuō)服力的正確說(shuō)法?!?/p>

Goodfellow很可能是對(duì)的,但他的結(jié)論是,科技不能解決假新聞問(wèn)題,雖然這不是人們想聽(tīng)到的。

微信搜索【AI商業(yè)報(bào)道】,獲取最新行業(yè)資訊!

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2018-02-28
GAN深度學(xué)習(xí)模型之父:一個(gè)給予了機(jī)器想象力的男人
高層速讀關(guān)鍵信息:通過(guò)將兩種神經(jīng)網(wǎng)絡(luò)進(jìn)行相互對(duì)立。GAN在生成模型和判別模型的互相博弈學(xué)習(xí)產(chǎn)生好的輸出,能夠給予機(jī)器想象、創(chuàng)造的東西,具有一定的自主意識(shí)。

長(zhǎng)按掃碼 閱讀全文