神经网络变成小怪兽，还能互相 battle！这款游戏用最简单的方式训练神经网络

机器之心报道

编辑：魔王

在游戏里训练「神经网络小怪兽」，学习强化学习！

想了解神经网络，但不知道如何入手？教程太枯燥，论文不好懂？

别怕，这里有款多人在线战术竞技游戏（MOBA），让你在西部牛仔的世界中训练自己的神经网络。在这里，所有「智能体」都是类似怪兽的生物，还有武器！

故事的背景是：Derk 博士想要创建一个具备「神经网络」大脑的生物。

这款名为「Dr. Derk's Mutant Battlegrounds」的游戏是一个基于 AI 的实验性游戏。玩家的任务是武装自己的小怪兽（Derkling）并训练，与其他玩家进行 battle。

而这些小怪兽其实是货真价实的 AI：循环神经网络（RNN）。它具备 30 个输入、12 个输出、32 个记忆插槽（memory slot）、1 个隐藏层和 3000 多个参数，能够「看到」30 多项事物，还能自主决策。

哇，神经网络这么 cute 吗！是不是很想赋予它超能力？

闯关和 battle 胜利，你就可以升级小怪兽的能力和装备！而这对玩家的挑战在于：选择最好的装备和训练策略。

在这个游戏环境中，有大量策略可供探索，玩家可以教小怪兽进行大量尝试。比如教它们如何治疗上单，穿过敌人的队伍直达敌军老巢（雕像），或者戏耍对手…… 玩家可以在这里尽情尝试和探索不同的策略。

经过多次迭代，小怪兽终于直达敌军老巢，干掉了敌方的雕像。

小怪兽升级装备了，有枪！

这次不再是与游戏内置的 boss 对战，而是玩家团战。看起来战况很激烈！

Derk 博士使用了哪些技术，帮助小怪兽成长

就整体技术而言，这款游戏使用的技术类似于 OpenAI Five。OpenAI Five 两年前打败了 Dota 2 人类玩家，不过这款游戏中的小怪兽的脑袋远不如「OpenAI Five」那么强悍。

此外，这款游戏的技术细节还包括：

小怪兽通过 GA 在并行运行的 128 个「竞技场」（arenas）上进行训练；
所有的模拟和神经网络均在 GPU 上运行，方便快速获取结果（在一台性能不错的计算机上 1 分钟内即可训练 200 代）；
智能体可以和游戏内置机器人 PK，也可以互相 battle（自对弈），或者将这两者结合起来；
对于想要深度挖掘小怪兽的「大脑」，充分理解其行为的人而言，这款游戏提供了不错的可视化效果。

目前，这款游戏已发布到 Steam。

参考链接：

https://www.reddit.com/r/MachineLearning/comments/i1o8m0/p_i_created_a_game_for_learning_rl/

https://www.youtube.com/watch?time_continue=27&v=-Lqb8cce5tk&feature=emb_logo

https://derkgame.com

机器之心联合旷视科技开设线上公开课：零基础入门旷视天元MegEngine，通过6次课程帮助开发者入门深度学习开发。

8月4日，旷视研究院深度学习框架研究员刘清一将带来等二课，主要介绍数据预处理、模型搭建与调参等相关概念。欢迎大家入群学习。

转载请联系本公众号获得授权

投稿或寻求报道：[email protected]

继续阅读

阅读原文

关键词

小怪兽

技术