国产美女自卫慰视频福利,十分钟在线观看视频高清www

AlphaZero問(wèn)世:8小時(shí)完爆圍棋、國(guó)際象棋、日本將棋

人閱讀

2017-12-08 13:17:00

來(lái)源：人工智能網(wǎng)
相關(guān)關(guān)鍵詞
- 人工智能
- AI

日前，DeepMind團(tuán)隊(duì)發(fā)表了最新論文，提出了全新的強(qiáng)化學(xué)習(xí)算法AlphaZero，它是一種可以從零開(kāi)始，通過(guò)自我對(duì)弈強(qiáng)化學(xué)習(xí)在多種任務(wù)上達(dá)到超越人類水平的新算法，堪稱“通用棋類AI”。

據(jù)了解，AlphaZero算法可以在8個(gè)小時(shí)訓(xùn)練擊敗李世石版本AlphaGo；再用4小時(shí)訓(xùn)練擊敗世界頂級(jí)的國(guó)際象棋程序Stockfish；再用2小時(shí)訓(xùn)練擊敗世界頂級(jí)將棋程序Elmo。這是DeepMind團(tuán)隊(duì)繼AlphaGo Zero的研究問(wèn)世之后，帶給我們的又一全新算法，它是“更通用的版本”。

此外，我們看到這次的AlphaZero與AlphaGo Zero有幾點(diǎn)不同，首先AlphaGo Zero是在假設(shè)結(jié)果為贏/輸二元的情況下，對(duì)獲勝概率進(jìn)行估計(jì)和優(yōu)化。而AlphaZero會(huì)將平局或其他潛在結(jié)果納入考慮，對(duì)結(jié)果進(jìn)行估計(jì)和優(yōu)化。其次，AlphaGo和AlphaGo Zero會(huì)轉(zhuǎn)變棋盤(pán)位置進(jìn)行數(shù)據(jù)增強(qiáng)，而AlphaZero不會(huì)。第三，AlphaZero只維護(hù)單一的一個(gè)神經(jīng)網(wǎng)絡(luò)，這個(gè)神經(jīng)網(wǎng)絡(luò)不斷更新，而不是等待迭代，四，AlphaZero中，所有對(duì)弈都重復(fù)使用相同的超參數(shù)，因此無(wú)需進(jìn)行針對(duì)特定某種游戲的調(diào)整。

資料顯示，阿爾法圍棋（AlphaGo）是第一個(gè)擊敗人類職業(yè)圍棋選手、第一個(gè)戰(zhàn)勝圍棋世界冠軍的人工智能程序，它由谷歌（Google）旗下DeepMind公司戴密斯·哈薩比斯領(lǐng)銜的團(tuán)隊(duì)開(kāi)發(fā)。其主要工作原理是“深度學(xué)習(xí)”。

早在2016年3月，阿爾法圍棋與圍棋世界冠軍、職業(yè)九段棋手李世石進(jìn)行圍棋人機(jī)大戰(zhàn)，以4比1的總比分獲勝；2016年末2017年初，該程序在中國(guó)棋類網(wǎng)站上以“大師”（Master）為注冊(cè)帳號(hào)與中日韓數(shù)十位圍棋高手進(jìn)行快棋對(duì)決，連續(xù)60局無(wú)一敗績(jī)；2017年5月，在中國(guó)烏鎮(zhèn)圍棋峰會(huì)上，它與排名世界第一的世界圍棋冠軍柯潔對(duì)戰(zhàn)，以3比0的總比分獲勝。圍棋界公認(rèn)阿爾法圍棋的棋力已經(jīng)超過(guò)人類職業(yè)圍棋頂尖水平，在GoRatings網(wǎng)站公布的世界職業(yè)圍棋排名中，其等級(jí)分曾超過(guò)排名人類第一的棋手柯潔。

2017年5月27日，在柯潔與阿爾法圍棋的人機(jī)大戰(zhàn)之后，阿爾法圍棋團(tuán)隊(duì)宣布阿爾法圍棋將不再參加圍棋比賽。

2017年10月18日，DeepMind團(tuán)隊(duì)公布了最強(qiáng)版AlphaGo ，代號(hào)AlphaGo Zero。

而這次，在短短的兩個(gè)月之后，最強(qiáng)版的AlphaGo Zero就完成了進(jìn)化，變身AlphaZero。

查看更多內(nèi)容請(qǐng)點(diǎn)擊論文地址：https://arxiv.org/pdf/1712.01815.pdf

（免責(zé)聲明：本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請(qǐng)進(jìn)一步核實(shí)，并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏，概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí)，應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明，并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后，將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí)，溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。）