卡內(nèi)基梅隆大學(xué)計(jì)算機(jī)科學(xué)學(xué)院院長(zhǎng)安德魯·摩爾接受采訪
冷撲大師沒有使用深度學(xué)習(xí),這多少有點(diǎn)風(fēng)水輪流轉(zhuǎn)的意思。
4月6日,在美國(guó)擊敗人類頂尖德州撲克選手的人工智能Liberatus接受創(chuàng)新工場(chǎng)邀請(qǐng),化名“冷撲大師”,將在海南挑戰(zhàn)中國(guó)職業(yè)德州撲克選手組成的“龍之隊(duì)”。賽前在接受新浪科技專訪時(shí),開發(fā)冷撲大師的卡內(nèi)基梅隆大學(xué)計(jì)算機(jī)科學(xué)學(xué)院院長(zhǎng)安德魯·摩爾(Andrew Moore)揭示了在另一場(chǎng)人機(jī)大戰(zhàn)中,戰(zhàn)勝人類背后的基本原理:更加古老的線性規(guī)劃(Liner Programming)。
在解決面對(duì)不完整信息,獲得最佳策略的問題方面,線性規(guī)劃早就已經(jīng)成為重要方法。在微觀經(jīng)濟(jì)學(xué)和商業(yè)管理領(lǐng)域當(dāng)中,這種算法已經(jīng)被大量應(yīng)用在降低生產(chǎn)流程成本。而在人工智能領(lǐng)域,它和深度學(xué)習(xí)火熱之前的主流:貝葉斯網(wǎng)絡(luò)技術(shù)息息相關(guān),而后者也目前互聯(lián)網(wǎng)的通用基礎(chǔ)技術(shù)之一。
2017年1月11日,職業(yè)撲克選手賈森·萊斯(Jason Les)在與Libratus較量德州撲克。1月30日,卡內(nèi)基梅隆大學(xué)開發(fā)的人工智能結(jié)束了與4名頂尖德州撲克選手之間的比賽,取得勝利。
在采訪開始前,摩爾表示,德州撲克游戲中包含了大量的隱藏信息,在本質(zhì)上就是一種談判。而通過人工智能談判其實(shí)是卡內(nèi)基梅隆大學(xué)研究團(tuán)隊(duì)的初衷。他表示,贏得撲克游戲勝利能讓人感覺人工智能非常厲害,但他也很期待人工智能能夠在協(xié)商談判并解決問題方面涌現(xiàn)出更多應(yīng)用。
以下為部分采訪實(shí)錄,新浪科技整理:
新浪科技:冷撲大師好像和AlphaGo不一樣,沒有從人類玩牌的結(jié)果中學(xué)習(xí)。德州撲克人工智能和圍棋人工智能有哪些不同?
安德魯·摩爾(以下簡(jiǎn)稱AM):撲克是一個(gè)規(guī)則非常簡(jiǎn)單的游戲,但是有很多隱藏信息,而圍棋沒有隱藏信息,所以做圍棋方面的人工智能,需要進(jìn)行非常深度的棋譜搜索。而做撲克游戲的人工智能要面對(duì)的問題是有非常多的詐唬策略要一一考慮。
新浪科技:冷撲大師有沒有使用到神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)技術(shù)?
AM:冷撲大師沒有使用神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)方面的技術(shù),而是使用了最為傳統(tǒng)的線性規(guī)劃(Liner Programming)。
我可以講得稍微細(xì)一點(diǎn)。計(jì)算機(jī)需要算出最合適數(shù)量的詐,因?yàn)闊o論詐數(shù)量過多或者過少,都可能被其他牌手利用。數(shù)學(xué)家約翰·納什曾經(jīng)計(jì)算出的一個(gè)等式來解決類似的問題,但是要想真的計(jì)算出最合適數(shù)量的詐,這個(gè)等式可能會(huì)有無數(shù)的變量,而我們?cè)诶鋼浯髱熒砩蠎?yīng)用的計(jì)算機(jī)技術(shù)可以得出最接近正確答案的解決方式。
新浪科技:李開復(fù)之前寫過自己玩德州撲克的感受,他說想要玩好,就要把人性擺在一邊。冷撲大師在比賽時(shí)是靠算牌,還是用統(tǒng)計(jì)方式研究對(duì)手打心理戰(zhàn)?
AM:算牌是贏牌的正確方式。不過這樣做的計(jì)算量很大,冷撲大師需要完成1000萬小時(shí)的計(jì)算才能形成它的策略。
但用統(tǒng)計(jì)數(shù)據(jù)來研究對(duì)手玩法不是一個(gè)好辦法,因?yàn)橐坏┪抑滥阍诮y(tǒng)計(jì)我的玩法,我就會(huì)故意使用變換押注方法,實(shí)際上可以繞開你。
所以就像我剛才說的,冷撲大師沒有使用心理戰(zhàn)贏牌的企圖,只是使用數(shù)學(xué)方法而已。
實(shí)際上過去十年是大數(shù)據(jù)和機(jī)器學(xué)習(xí)發(fā)展的十年。但冷撲大師所用的線性規(guī)劃與這兩者有很大不同,它是實(shí)現(xiàn)最優(yōu)解(Big Optimization)的技術(shù),相信未來的技術(shù)前沿也是實(shí)現(xiàn)最優(yōu)解的技術(shù)。
4月6日,6位華人牌手組成的中國(guó)龍之隊(duì)將在海南挑戰(zhàn)Libratus。但隊(duì)長(zhǎng)杜悅(左四)表示,龍之隊(duì)的勝算可能只有10%。
新浪科技:和龍之隊(duì)比賽的賽制,與常見的多人德州撲克牌局不同。為什么會(huì)選擇一對(duì)一形式的比賽?是和算法限制有關(guān)嗎?
AM:德州撲克中最考驗(yàn)牌手技術(shù)的反而是雙人對(duì)戰(zhàn),如果有更多牌手的話,其他牌手間的技術(shù)差別反而會(huì)被利用。
新浪科技:除了德州撲克之外,冷撲大師所采用的技術(shù)還可以用在哪些領(lǐng)域?
AM:我最喜歡的商業(yè)用途當(dāng)然是商業(yè)談判,可以通過人工智能來實(shí)現(xiàn)在最合適的時(shí)間,以最合適的價(jià)格找到最合適的供應(yīng)商。
談判其實(shí)是非完整信息博弈理論中一個(gè)不錯(cuò)的例子,因?yàn)檎勁械臅r(shí)候,我們不一定會(huì)透露真實(shí)的想法。我們的研究人員認(rèn)為計(jì)算機(jī)能夠與人類或者其他計(jì)算機(jī)進(jìn)行交談和談判的能力非常重要。計(jì)算機(jī)的這種能力就是我們下一個(gè)研究方向。
實(shí)際上,除了德州撲克之外,相同算法還可以幫助很多需要器官移植的人,比方說Kidney Exchange。在美國(guó),這個(gè)算法每年能幫助數(shù)百位患者實(shí)現(xiàn)腎臟移植的匹配。
新浪科技:所以冷撲大師背后的技術(shù)實(shí)際上是通用的。
AM:冷撲大師所采用的技術(shù)確實(shí)可以應(yīng)用到其他領(lǐng)域,來幫助人類找回丟失掉的信息。比如購(gòu)買一間公寓,這就是一個(gè)談判過程。如果我聘請(qǐng)的人類房產(chǎn)中介直接告訴賣家我愿意出多少錢買他的房子,那我肯定馬上炒他的魷魚。因?yàn)樗墓ぷ骶褪窃陔[藏我信息的前提下,和賣家達(dá)成交易。
新浪科技:怎么看待中國(guó)的人工智能市場(chǎng)?對(duì)人工智能開發(fā)者有什么建議?
AM:從投資數(shù)量上能看出中國(guó)人工智能市場(chǎng)的發(fā)展是多么欣欣向榮。這是非常明智的投資,因?yàn)楦餍懈鳂I(yè)的自動(dòng)化是未來經(jīng)濟(jì)增長(zhǎng)的強(qiáng)勁動(dòng)力。
但是,我認(rèn)為一般意義上的人工智能技術(shù)工具,發(fā)展前景其實(shí)不大,而可以直接用于行業(yè)發(fā)展的人工智能才有真正的發(fā)展前景。我喜歡哪些可以將技術(shù)應(yīng)用在已有行業(yè)的人工智能初創(chuàng)公司,而不是那些研發(fā)一般性技術(shù)供其它公司使用的企業(yè)。
就我個(gè)人來說,如果你的初創(chuàng)公司有可以幫助自閉癥兒童快速學(xué)習(xí)的人工智能技術(shù),那我就會(huì)有非常強(qiáng)烈的興趣。而如果你的公司有可以讓機(jī)器學(xué)習(xí)更加準(zhǔn)確的技術(shù),那就不是很好了。
2015年,創(chuàng)新工場(chǎng)CEO李開復(fù)獲得卡內(nèi)基梅隆大學(xué)授予榮譽(yù)博士畢業(yè)前,與安德魯·摩爾(右一)的合影。
新浪科技: 2015年卡內(nèi)基梅隆大學(xué)有將近50名科學(xué)家陸續(xù)被Uber挖走。而人工智能領(lǐng)域的頂尖專家加入企業(yè)也是目前的趨勢(shì)。您對(duì)當(dāng)前人工智能教育環(huán)境是否有擔(dān)憂?
AM:從2015年1月起,我們新錄用了26名教職員工,而只有4個(gè)人離開。目前匹茲堡(卡內(nèi)基梅隆大學(xué)所在地)也已經(jīng)成為了全世界的自動(dòng)駕駛技術(shù)中心??蒲袑<壹尤肫髽I(yè)看似是個(gè)問題,但這反而對(duì)大學(xué)和匹茲堡都有利。
實(shí)際上,我在擔(dān)任卡內(nèi)基梅隆大學(xué)計(jì)算機(jī)科學(xué)學(xué)院院長(zhǎng)之前,在谷歌從事機(jī)器學(xué)習(xí)系統(tǒng)方面的工作。雖然我喜歡谷歌的哦概念股走,但我還是決定重新回到卡內(nèi)基梅隆大學(xué),因?yàn)楫?dāng)今世界上最頂尖大學(xué)所從事的研究共奏是極其重要的,也將決定21世紀(jì)的發(fā)展情況。而我所需要解決的一個(gè)問題就是,在一個(gè)人工智能已經(jīng)實(shí)現(xiàn)商業(yè)化的世界里,大學(xué)可以扮演什么角色。
比如卡內(nèi)基梅隆在10-15年前就已經(jīng)開發(fā)出了自動(dòng)駕駛技術(shù),那么下一步應(yīng)該做什么?我們不想一直關(guān)注業(yè)界已經(jīng)在做的事情,而是可以有哪些前瞻性的研究。
對(duì)于想離開大學(xué)的教職工,我不是勸留,而是鼓勵(lì)他們這樣做。其實(shí)開發(fā)冷撲大師的Toumas Sandholm就已經(jīng)建立了一家公司,叫Strategic Machine Inc.。這家公司就是從卡內(nèi)基梅隆大學(xué)拆分出來的。大學(xué)會(huì)將人工智能應(yīng)用在撲克上的技術(shù)授權(quán)給公司,公司再專注與不完整信息博弈的研發(fā)和商業(yè)應(yīng)用。
對(duì)于新錄用的人,我其實(shí)會(huì)建議他們?cè)谶@里做4-5年的研究,加入業(yè)界工作上3年,然后再回來做5年研究,這才是應(yīng)該有的職業(yè)生涯,二者都不耽誤。
- 美的高管回應(yīng):累計(jì)售出0阻垢劑凈水器超1000萬套
- 2025年Q1全球PC出貨量同比增長(zhǎng)4.8%,聯(lián)想錄得全球及美國(guó)市場(chǎng)最快增速
- 2025年全球GenAI手機(jī)出貨量有望突破4億部,滲透率約占三分之一
- 蘋果CEO幕后運(yùn)作,庫(kù)克是如何說服特朗普豁免關(guān)稅的?
- 華為智能門鎖2亮相:解鎖新體驗(yàn),掌靜脈識(shí)別+超清貓眼,安全又便捷,僅售2499元!
- 華為智慧屏新品發(fā)布:智慧與顏值并存,國(guó)補(bǔ)后僅售3999.2元起
- 綠米Aqara智能溫控器W400新上市:三合一設(shè)備接入,雙協(xié)議支持,物超所值的智能家居新選擇!
- 華為新智能門鎖:掌靜脈識(shí)別解鎖,安全守護(hù)升級(jí),4月16日預(yù)售等你來!
- 華為智能眼鏡2代:鈦空?qǐng)A框與光學(xué)鏡完美融合,售價(jià)2299元,科技與時(shí)尚的完美結(jié)合?
- OPPO新款智能手表:小巧實(shí)用,行業(yè)首出發(fā)出安全守護(hù),僅售1529元起
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。