14日凌晨(chén)2:30,OpenAI Fie在和第(dì)八届Dota2国际邀请(qǐng)赛世界冠军OG团队的比赛中连胜两局,碾压了人类选手。
在2018年8月的Ti8 OpenAI表演赛上,人(rén)类职业战队(duì)paiN Gaming在5v5的Dota2人机大中(zhōng),轻松击败OpenAI Five战队(duì)。在输掉(diào)比赛之(zhī)后,OpenAIFive是通过在加速的虚拟环境中进行自我改(gǎi)进而(ér)变得(dé)更加强(qiáng)大的。
OpenAIFive由深(shēn)度(dù)强化学习(xí)提供支持,也就是说它的(de)编码目的不是“如何游戏”,而是“如何学习”。Brockman在比(bǐ)赛开始(shǐ)前(qián)表(biǎo)示。AI在(zài)10个月中,已经玩(wán)了45000年的Dota2游戏,而且,玩了这么长时间也没(méi)有(yǒu)觉得无聊。
经过了45000年训练的OpenAI Fie在今早的比赛中表现出(chū)是迄今为止展示出的最高水(shuǐ)平,而且打(dǎ)法(fǎ)激进,甚至在(zài)游戏前期(qī)频(pín)繁买(mǎi)活,所以当(dāng)它摧毁OG战(zhàn)队(duì)基地时,好多人对此(cǐ)惊(jīng)奇不已(yǐ)。但(dàn)当它在第二局以迅(xùn)雷不及掩耳之势碾压了OG时,赢(yíng)得了现场观众的掌声。
在这场人机大战中(zhōng),每队只有(yǒu)17个英雄可供选择。OpenAI还选择了所(suǒ)谓的“Captain'sDraft”游戏模式。与之前的比(bǐ)赛一样,OpenAI也禁(jìn)用了召(zhào)唤(huàn)和幻觉功(gōng)能,这两项功能都涉(shè)及以英雄副(fù)本的形式引入其(qí)他(tā)变(biàn)量,以及OpenAI训练系(xì)统时未(wèi)考虑的一些特殊(shū)因素和单(dān)位。除此之外(wài),这场比赛与正(zhèng)常的(de)Dota2比(bǐ)赛一样(yàng),其最终目(mù)标是摧毁敌(dí)方队伍的“基地”,即每个团队领土末端的大(dà)型塔楼,在(zài)敌人的队伍成功摧(cuī)毁其他小型塔后(hòu),基地是很脆弱的,整个比赛过(guò)程的(de)中心(xīn)是对塔的攻(gōng)防,以及英雄与英雄之间的团(tuán)战。
portant;" />
在第(dì)一场比赛中(zhōng),OpenAIFive让对(duì)手(shǒu)OG大吃一惊,通过(guò)一系列激进(jìn)战(zhàn)术获得了(le)胜(shèng)利,其中包括对游(yóu)戏中获取的金币(bì)的花费方式,在本方英雄死亡时立即买活,即使在比赛(sài)初期也是如此。
在第二场比赛中(zhōng),OpenAI表现更好,在最初(chū)的几分钟内即获得了对(duì)OG的早(zǎo)期优势,然后无情碾压了人类玩家,在第一场比赛(sài)时间刚刚(gāng)过(guò)半的时间点上即取得胜(shèng)利。
值得注意的是,OpenAIFive在第二场(chǎng)比(bǐ)赛中开(kāi)始玩得异常(cháng)激进,以致OG在(zài)AI全图范围内的(de)推进时(shí)有些无力对抗。OpenAIFive能(néng)够利用其特定的英雄选择带来(lái)的优势(shì)。
在这场比赛之(zhī)后,研究团队将不再公(gōng)开展示其(qí)AI游(yóu)戏bot,而是致力(lì)于(yú)开发软(ruǎn)件,让人类与OpenAIFive软件实(shí)时协作,与机器人一(yī)起玩游戏,并学习他们独特的前所未有的战略(luè)和行为。
而最终,OpenAI希望将其Dota2学习并(bìng)扩展到(dào)游戏之(zhī)外的(de)新领域,并最终扩展到现实(shí)世(shì)界(jiè)中。为此,OpenAI正致(zhì)力于使(shǐ)用强化学习和其(qí)他技术,为(wéi)机器人手提供更灵(líng)巧、更精细(xì)、更人性(xìng)化的动作。