Google-ki DeepMind通過自己的訓練成功地掌握了捕獲的地質3競技場模式,以至於她可以擊敗人類團隊。
後Ki項目在Dota 2中對人類玩家開放AI的巨大成功Google添加了自己的DeepMind AI:研究團隊設法訓練AI的方式,以至於她可以在捕獲的Flag-the Flag of Quake 3競技場中擊敗人類團隊。
如何佛教徒報告,AI開發人員依靠所謂的加強學習。 AI訓練一種反複試驗的原則,並對抗自己,直到它盡可能地理解遊戲原理為止。 DeepMind進行了將近500萬場比賽,持續了五分鐘 - 這使得總訓練期在41,667小時(或1,736天)左右。
Windows 10中的遊戲模式 - 由於遊戲模式的性能更好嗎?
在培訓期間,AI自我教授了捕捉第3號旗幟的所有要素,包括征服和守護國旗和在對手底部露營。在培訓期間,AI並未使用(如開放AI和LOL)來數值數據,而僅通過Quake -3 UI收到有關遊戲的信息。
完成培訓後,AI開發人員DeepMind與來自兩名球員的球隊進行了競爭,包括來自機器人,人員和兩者組合的球隊。結果,最佳(強)人類團隊的獲勝率最高的純機器人團隊僅達到52%。
但是,AI的勝利率降低了AI團隊的球員的更多球員。對於四個AI球員來說,獲勝率只有65%,因此在團隊合作上只能有點努力。但是,Versge在報告中未討論目標因素,除了策略之外,在像策略之外的射手之外也非常重要。
為了編程一個,以便他始終達到目標比在戰術上明智的行為要容易得多 - 如果您在“噩夢”難度水平上的單人Quake 3競技場中與最後一個機器人對手Xaero作戰,那麼您可以唱歌。