DeepMind发布游戏增强学习框架OpenSpiel

  • 日期:09-23
  • 点击:(1591)


DeepMind研究团队已经发布了一个名为OpenSpiel的面向游戏的增强学习框架,该框架提供了用于增强学习需求,用于一般增强学习,搜索和计划研究的环境和算法,以及用于分析和增强学习动态的工具。作为常见的评估指标。

研究人员提到,OpenSpiel的目标是在各种游戏类型中促进多智能体增强学习,类似于一般的游戏训练环境,但更多地侧重于学习而非竞争。研究人员希望OpenSpiel可以在单个代理中实现Atari学习环境,以增强通用增强型学习中的学习,这对通用增强型学习的发展具有重大影响。

OpenSpiel为研究人员提供了一个评估各种基准游戏中的游戏和算法的框架。 OpenSpiel包括20多种不同类型的游戏,包括世界网格游戏,拍卖游戏和矩阵游戏。涵盖单个或多个代理的零和,合作,一般和和博弈,以及一次性和连续博弈研究。这些游戏是用C ++编写的,并用Python打包。

OpenSpiel的算法基于C ++或Python。官方提到,这两种语言的API几乎相同,因此当开发人员需要时,它们可以在两种语言之间进行切换,并且大多数学习算法都是使用Tensorflow用Python编写的,该官员目前正在开发支持用于PyTorch和JAX。此外,OpenSpiel库的一个子集已移植到Swift,因此开发人员还可以在MacOS设备上进行研究。

deepmind只在linux上测试openspiel,但是研究人员提到,虽然他们没有在macos和windows上测试,但是在编译和执行方面预计不会有太多问题。openspiel的主要设计理念是简单和最小的,使用参考示例而不是完全优化和高性能的程序代码,同时保持最小的可能依赖性并减少兼容性问题的可能性。

最近,许多组织都推出了研究工具来加强学习。例如,谷歌的大脑已经开启了足球强化学习环境项目谷歌研究足球,Facebook也发布了强化学习平台地平线。英特尔还推出了一系列增强的rl-coach学习。工具。

——