近日,IEEE 2021游戲會(huì)議(IEEE CoG 2021)格斗游戲AI競賽(FTGAIC 2021)的成績正式揭曉。網(wǎng)易互娛AI Lab 在競賽的兩個(gè)賽道、三個(gè)角色,共六個(gè)項(xiàng)目中均斬獲第一,以150分的總成績滿分奪冠,一舉擊敗來自中、日、韓等多個(gè)國家的頂級(jí)學(xué)府和科研強(qiáng)隊(duì),其中包括曾連續(xù)獲得四次冠軍和一次亞軍的日本參賽隊(duì)伍,以及去年奪冠的中國科學(xué)院自動(dòng)化研究所,成為9年競賽史上首個(gè)滿分全勝的隊(duì)伍。
IEEE CoG 2021是專注于游戲領(lǐng)域的人工智能國際會(huì)議,每年都有來自全球各地的專家學(xué)者和開發(fā)人員匯聚于此,共同探討游戲技術(shù)與設(shè)計(jì)相關(guān)的前沿話題和未來趨勢。FTGAIC作為大會(huì)官方舉辦的雙人格斗游戲AI實(shí)時(shí)對(duì)抗競賽,由于其兼具挑戰(zhàn)性和趣味性,自2013年首次推出便吸引海內(nèi)外強(qiáng)隊(duì)踴躍參加。該競賽要求參賽算法控制三種不同屬性的格斗角色,使其在16.67ms的反應(yīng)時(shí)間內(nèi)從56個(gè)離散動(dòng)作中做出最佳決策,進(jìn)而在有限時(shí)間內(nèi)快速擊敗對(duì)方算法控制的智能體。該賽題的根本其實(shí)是實(shí)時(shí)雙人零和博弈問題,屬于非完美信息博弈,在同步?jīng)Q策的過程中智能體無法準(zhǔn)確獲取對(duì)方正要采取的動(dòng)作行為,因此會(huì)對(duì)其有效決策行為造成影響。此外,競賽中兩個(gè)角色的屬性對(duì)于參賽選手而言是未知的,這也大大增加了研發(fā)的難度。
在此次競賽中,網(wǎng)易互娛AI Lab創(chuàng)新性地使用了自研的分布式深度強(qiáng)化學(xué)習(xí)框架和自博弈訓(xùn)練范式的PPO算法,該自研框架具有良好的適應(yīng)性和可擴(kuò)展性,支持不同規(guī)模的分布式訓(xùn)練,同時(shí)也支持自博弈訓(xùn)練范式。相比往屆冠軍隊(duì)伍都采用的啟發(fā)式搜索算法,深度強(qiáng)化學(xué)習(xí)算法無需基于專業(yè)知識(shí)對(duì)所有搜索空間進(jìn)行約減,只需在原始的狀態(tài)空間和動(dòng)作空間進(jìn)行訓(xùn)練,大幅提高了AI設(shè)計(jì)效率。此外,為了避免受到游戲角色屬性被修改的影響,網(wǎng)易互娛AI Lab在訓(xùn)練時(shí)還對(duì)角色屬性進(jìn)行了隨機(jī)修改,獲得了更為魯棒的策略。最終,在Speedrunning模式下,網(wǎng)易互娛AI Lab的AI擊敗內(nèi)置MCTS AI的平均用時(shí)僅為第二名的二分之一左右。而在Standard模式下,網(wǎng)易互娛AI Lab的AI使用三個(gè)不同角色與其他參賽隊(duì)對(duì)戰(zhàn)的勝率分別達(dá)到了 98.3%,96.7%,100%。
網(wǎng)易互娛AI Lab(BlackMamba)與其他參賽隊(duì)的時(shí)間對(duì)比
網(wǎng)易互娛AI Lab(BlackMamba)與其他參賽對(duì)手的勝利局?jǐn)?shù)對(duì)比
在本次大賽上,網(wǎng)易互娛AI Lab另辟蹊徑,以深度強(qiáng)化學(xué)習(xí)方法替代搜索性算法(蒙特卡洛樹搜索、演化算法)奪得競賽冠軍,打破了后者在該比賽近五年的統(tǒng)治地位,證明了網(wǎng)易互娛AI Lab在游戲AI領(lǐng)域的技術(shù)優(yōu)勢和工程實(shí)力。從過去的國際象棋和圍棋等回合制雙人零和博弈,到如今更加復(fù)雜的實(shí)時(shí)策略型游戲,游戲AI一直在推動(dòng)人工智能的核心發(fā)展。網(wǎng)易互娛AI Lab也一直將游戲AI作為研究的核心領(lǐng)域之一,希望能夠?qū)⒀芯砍晒床傅接螒蛑腥ィ粩嘭S富和提升玩家的游戲體驗(yàn),同時(shí)也希望AI+游戲的研究成果能夠被延伸至游戲外的更廣泛的應(yīng)用領(lǐng)域,向通用型人工智能探索和邁進(jìn)。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )