阿爾法狗再進化自學(xué)三天勝人千年 谷歌用它來做什么

早在今年五月對弈柯潔之前,AlphaGo就已經(jīng)從“狗”進化為“神”,無需依賴人類訓(xùn)練師,但谷歌的野心并不止步于此,Deepmind公司1/4精力已經(jīng)被用于商業(yè)實踐和變現(xiàn)


阿爾法狗再進化自學(xué)三天勝人千年 谷歌用它來做什么


北京時間10月19日凌晨,谷歌旗下的人工智能公司DeepMind在世界頂級科學(xué)雜志Nature雜志上宣布了AlphaGo的新進步,可以在沒有人類干預(yù)的情況下自我學(xué)習(xí),新的AlphaGoZero在自我學(xué)習(xí)3天之后,就以100比0的成績戰(zhàn)勝了第一代AlphaGo。

自我學(xué)習(xí)能力的出現(xiàn),對于人工智能和機器學(xué)習(xí)來說,是一個新的突破。“過去人們普遍認(rèn)為機器學(xué)習(xí)是基于海量的大數(shù)據(jù),但是從AlphaGoZero身上,我們發(fā)現(xiàn)算法比數(shù)據(jù)更重要?!盇lphaGo項目的主要負(fù)責(zé)人戴維·席爾瓦(David Silver)說道。

也由于使用了更多的算法和更少的數(shù)據(jù),所以AlphaGoZero只使用了一臺計算機器和4個TPU,被它打敗的一代AlphaGo則用到多臺機器和48個TPU。

當(dāng)人們驚訝于AlphaGoZero在圍棋領(lǐng)域的神級水平時,對于DeepMind團隊來說,這才只是剛剛開始,他們的目的是通過培養(yǎng)自主學(xué)習(xí)的能力,來解決更多其他領(lǐng)域目前無法解決的棘手問題。

從AlphaGo、AlphaGoMaster到AlphaGo Zero

AlphaGo于2015年10月面世,在廣為人知的與棋手李世石對弈之前,它已經(jīng)打敗了歐洲圍棋冠軍樊麾。樊麾接受《財經(jīng)》記者采訪時表示,當(dāng)時在他看來,一個計算程序要打敗職業(yè)棋手是不可能的事情。

結(jié)果他以0-5輸給了AlphaGo,但他也因此加入了DeepMind團隊,幫助訓(xùn)練AlphaGo。2016年3月,在他幫助訓(xùn)練下的AlphaGo以4-1的成績打敗了人類頂尖棋手李世石。2017年初,AlphaGo化名為“Master”,在網(wǎng)絡(luò)上挑戰(zhàn)60名人類棋手,保持全勝的成績。2017年5月,在烏鎮(zhèn)的,名為Master的第二代AlphaGo以3-0戰(zhàn)勝了目前人類最強棋手柯潔。

今年5月的比賽期間,DeepMind的多位高管就已經(jīng)向《財經(jīng)》記者透露,Master已經(jīng)實現(xiàn)了自我學(xué)習(xí)能力,甚至有了自己的“直覺”,“我們發(fā)現(xiàn)AlphaGo已經(jīng)不需要依賴人類訓(xùn)練師了?!贝骶S·席爾瓦告訴《財經(jīng)》記者。

與柯潔的對弈中,AlphaGo已經(jīng)能下出很多人類棋手完全無法想象的路數(shù),比賽后柯潔表示,第一代的AlphaGo還能找到破綻,Master已經(jīng)實現(xiàn)了“從人到神”的飛躍。

而AlphaGoZero在“獨立”上更進一步,在訓(xùn)練的過程中,它是自我對弈。從訓(xùn)練圖上可以看出,由于一開始并不熟悉圍棋,對弈雙方的水平都很弱,但是隨著時間的推進,在短短3天互相博弈490萬局后,越來越強,實現(xiàn)了圍棋水平的突破。


(圖:AlphaGo訓(xùn)練的72小時圖譜)


(圖:AlphaGo訓(xùn)練的72小時圖譜)

人類頂尖棋手柯潔被認(rèn)為是圍棋天才,6歲開始學(xué)棋,17歲時在世界范圍內(nèi)排名第一,一個人類天才十幾年的學(xué)習(xí),被AlphaZero用3天時間超越。

但DeepMind團隊志不在此,“AlphaGo的意義不在于打敗人類,而是領(lǐng)悟知識,解決更多的問題。”戴維·席爾瓦表示。

商業(yè)化加速:1/4精力用于商業(yè)變現(xiàn)

今年5月,DeepMind創(chuàng)始人杰米斯·哈薩比斯在接受《財經(jīng)》記者采訪時表示:“如果說谷歌是火箭,DeepMind就是燃料?!?/p>

在此定位之下,AlphaGo雖然進化神速,但絕對不會止步于圍棋。

這家公司一開始只是一家位于英國倫敦的人工智能實驗室,研究方向是開發(fā)通用自我學(xué)習(xí)算法。2011年,哈薩比斯在埃隆·馬斯克等人的投資下,成立了DeepMind。2014年,谷歌以4億英鎊(約6.5億美元)的價格收購該公司,當(dāng)時這家公司只有50名員工。AlphaGo就來自于這家公司。

AlphaGo戰(zhàn)勝韓國第一棋手李世石引爆了AI技術(shù)和市場,也讓DeepMind在谷歌AI戰(zhàn)略中地位舉足輕重。

不過,DeepMind團隊從一開始研發(fā)AlphaGo系統(tǒng)的目的就是能實現(xiàn)行業(yè)應(yīng)用,并帶來商業(yè)價值。圍棋為AlphaGo帶來了光環(huán),卻并非最終目標(biāo)。

哈薩比斯對《財經(jīng)》記者說,“下一階段,DeepMind整個團隊75%的精力用于人工智能技術(shù)的研發(fā),另外25%精力放在行業(yè)應(yīng)用上。”

具體分工上,哈薩比斯繼續(xù)主導(dǎo)技術(shù)研究,另一位創(chuàng)始人穆斯塔法·蘇萊曼則負(fù)責(zé)主導(dǎo)商業(yè)化。

穆斯塔法認(rèn)為,繼續(xù)技術(shù)研究和商業(yè)化是一種平衡?!拔覀兪掷镉泻芏鄬嶒炇依锏男录夹g(shù),都是寶貴的資源,而這些技術(shù)的商用不僅能造福社會,一家公司也必須有可持續(xù)的商業(yè)利潤來源?!彼嬖V《財經(jīng)》記者。

據(jù)他介紹,目前DeepMind由兩個團隊組成,哈薩比斯負(fù)責(zé)研發(fā)團隊,而他負(fù)責(zé)技術(shù)應(yīng)用業(yè)務(wù)。技術(shù)應(yīng)用團隊又再分為三個組,一個組服務(wù)谷歌的產(chǎn)業(yè)和谷歌的其他業(yè)務(wù)部門;第二個是醫(yī)療組,已經(jīng)與英國的國家醫(yī)療健康局合作;第三個組是能源組,目前還在啟動階段。

“這樣的分組是為了方便與不同領(lǐng)域的專家更好地合作?!彼f。

此前,DeepMind已經(jīng)牛刀小試,成功利用機器學(xué)習(xí)為谷歌大幅度節(jié)約電量,帶來實際收益。

2016年,DeepMind團隊就利用AlphaGo的學(xué)習(xí)能力,不斷模擬探索更加省電的方案。DeepMind接管了谷歌數(shù)據(jù)中心的一些控制單元,包括風(fēng)扇、空調(diào)、窗戶和服務(wù)器等,通過機器學(xué)習(xí),幫助谷歌數(shù)據(jù)中心的冷卻系統(tǒng)節(jié)約用電40%,并提高了15%的能源使用效率。

哈薩比斯對《財經(jīng)》記者說:“谷歌在數(shù)據(jù)中心設(shè)備上的用電太多,幾個百分點就意味著每年幾百萬美元,節(jié)約電力的算法每分鐘都在給公司省一大筆錢?!?/p>

這個算法團隊的開發(fā)團隊僅有5、6個人,耗時僅兩三個月。

目前,DeepMind的部分研發(fā)項目已經(jīng)開始用于能源基礎(chǔ)設(shè)施管理、醫(yī)療系統(tǒng)和潔凈水源的改進等方面,公司也已經(jīng)從中獲得收益。

DeepMind也已開始進軍醫(yī)療市場并從中盈利。2015年11月,它與英國倫敦皇家自由醫(yī)院簽訂了為期五年的合同,任務(wù)是處理170萬名患者的醫(yī)療記錄。

在這次Nature雜志上發(fā)表的論文中,戴維·席爾瓦也強調(diào)了未來的行業(yè)應(yīng)用,例如蛋白質(zhì)折疊(用于破譯遺傳密碼)、能量節(jié)約以及新材料的研發(fā)等等。

在過去,機器學(xué)習(xí)未能得到廣泛應(yīng)用,主要原因之一就在于很多人類無法解決的領(lǐng)域中,也缺少大量的數(shù)據(jù)樣本來讓機器進行學(xué)習(xí),例如醫(yī)療圖像處理等。AlphaGoZero能夠擺脫人類的依賴,不需要人類給出數(shù)據(jù)和樣本,這為更廣泛的行業(yè)應(yīng)用提供了新的可能性。

這與谷歌成立母公司Alphabet實現(xiàn)組織變身的目的一致。母公司Alphabet創(chuàng)立后,整個企業(yè)資產(chǎn)負(fù)債表開始分賬計算,業(yè)務(wù)被獨立出來,明確了職責(zé)和成績,提升創(chuàng)新效率。

一位資本市場分析人士向《財經(jīng)》記者分析評價,如果一直在之前的架構(gòu)中,DeepMind對谷歌的技術(shù)輸血價值難以清晰衡量,DeepMind也很難有一個明確、長期、符合谷歌戰(zhàn)略的研究目標(biāo)。

更重要的一個原因是,資深科學(xué)家和強大的計算能力對AI業(yè)務(wù)的開展固然重要,但DeepMind走出去,獲取真實環(huán)境數(shù)據(jù)同樣重要,這些深入到行業(yè)的數(shù)據(jù),比如醫(yī)療,恰恰是谷歌缺失的數(shù)據(jù)源。作為一家搜索、社交基因的互聯(lián)網(wǎng)公司,谷歌手中的巨量數(shù)據(jù),多是開放社交屬性類數(shù)據(jù)。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2017-10-19
阿爾法狗再進化自學(xué)三天勝人千年 谷歌用它來做什么
早在今年五月對弈柯潔之前,AlphaGo就已經(jīng)從“狗”進化為“神”,無需依賴人類訓(xùn)練師,但谷歌的野心并不止步于此,Deepmind公司1 4精力已經(jīng)被用于商業(yè)實踐和變現(xiàn)

長按掃碼 閱讀全文