机器之心报道
编辑:魔王
在游戏里训练「神经网络小怪兽」,学习强化学习!
想了解神经网络,但不知道如何入手?教程太枯燥,论文不好懂?
别怕,这里有款多人在线战术竞技游戏(MOBA),让你在西部牛仔的世界中训练自己的神经网络。在这里,所有「智能体」都是类似怪兽的生物,还有武器!
故事的背景是:Derk 博士想要创建一个具备「神经网络」大脑的生物。
这款名为「Dr. Derk's Mutant Battlegrounds」的游戏是一个基于 AI 的实验性游戏。玩家的任务是武装自己的小怪兽(Derkling)并训练,与其他玩家进行 battle。
而这些小怪兽其实是货真价实的 AI:循环神经网络(RNN)。它具备 30 个输入、12 个输出、32 个记忆插槽(memory slot)、1 个隐藏层和 3000 多个参数,能够「看到」30 多项事物,还能自主决策。
 哇,神经网络这么 cute 吗!是不是很想赋予它超能力?
闯关和 battle 胜利,你就可以升级小怪兽的能力和装备!而这对玩家的挑战在于:选择最好的装备和训练策略。
在这个游戏环境中,有大量策略可供探索,玩家可以教小怪兽进行大量尝试。比如教它们如何治疗上单,穿过敌人的队伍直达敌军老巢(雕像),或者戏耍对手…… 玩家可以在这里尽情尝试和探索不同的策略。
经过多次迭代,小怪兽终于直达敌军老巢,干掉了敌方的雕像。
小怪兽升级装备了,有枪!
这次不再是与游戏内置的 boss 对战,而是玩家团战。看起来战况很激烈!
Derk 博士使用了哪些技术,帮助小怪兽成长
就整体技术而言,这款游戏使用的技术类似于 OpenAI Five。OpenAI Five 两年前打败了 Dota 2 人类玩家,不过这款游戏中的小怪兽的脑袋远不如「OpenAI Five」那么强悍。
此外,这款游戏的技术细节还包括:
  • 小怪兽通过 GA 在并行运行的 128 个「竞技场」(arenas)上进行训练;
  • 所有的模拟和神经网络均在 GPU 上运行,方便快速获取结果(在一台性能不错的计算机上 1 分钟内即可训练 200 代);
  • 智能体可以和游戏内置机器人 PK,也可以互相 battle(自对弈),或者将这两者结合起来;
  • 对于想要深度挖掘小怪兽的「大脑」,充分理解其行为的人而言,这款游戏提供了不错的可视化效果。
目前,这款游戏已发布到 Steam。
参考链接:
https://www.reddit.com/r/MachineLearning/comments/i1o8m0/p_i_created_a_game_for_learning_rl/

https://www.youtube.com/watch?time_continue=27&v=-Lqb8cce5tk&feature=emb_logo

https://derkgame.com
机器之心联合旷视科技开设线上公开课:零基础入门旷视天元MegEngine,通过6次课程帮助开发者入门深度学习开发。
8月4日,旷视研究院深度学习框架研究员刘清一将带来等二课,主要介绍数据预处理、模型搭建与调参等相关概念。欢迎大家入群学习。
© THE END 
转载请联系本公众号获得授权
投稿或寻求报道:[email protected]
继续阅读
阅读原文