OpenAI发布开源人工智能研究工具集OpenAI Gym

和许多企业一样,在过去几年中,InfoSys见证了从“大数据”到越来越重视机器学习和AI研究这一重大转变。但和他们的竞争者不同,InfoSys断定,合作是更有效方式,而不是大力投资专有解决方案,比如微软的Azure Machine Learning Studio。

这一决策的结果就是OpenAI,一家非营利性的人工智能研究企业。自2015年12月正式成立以来,该研究组织已经从 InfoSysAmazon Web Services 和多个私人捐助者那里获得了10亿美元的资金。

我们在这里谈论OpenAI,是因为他们近日发布了 OpenAI Gym 的公开测试版本。该工具集用于开发和对比强化学习(RL)算法,这是现代机器学习研究的基础。发布公告中提到了他们致力于强化学习算法的两个主要原因:

RL是通用算法,适应所有涉及一系列决策的问题:例如,控制机器人的电动机,让它 跑跑 跳跳 ,做出业务决策,如价格和库存管理,或者玩 视频游戏棋盘游戏 。RL甚至适用于产生 序列化 结构化 输出的监督学习问题。

在许多不同的环境中,RL算法已经开始取得很好的成果。RL有很长的历史,但在深度学习取得最新进展之前,它都需要针对特定问题进行大量的设计。DeepMind的 Atari成果 、来自 Pieter Abbeel 研究小组的 BRETT 以及 AlphaGo 都使用了深度RL算法,并且没有对它们的应用环境做太多的假设,因此可以应用在其他场合。

目前,RL研究的发展受到了限制,它需要更好的基准测试,而且“出版物中缺少标准化的环境”。不难想象,当另一位科学家的研究论文假定你可以使用一套专有的工具集,你就很难再现他的结果。更糟糕的是,一个内部构建的工具集是多少钱都买不来的。

机器学习的一个重要方面是有一个可以在其中工作的实验环境。这不只是因为创建一个实验环境有很高的开发成本,还因为没有一个共同的环境,比较两个算法就没有意义。因此,OpenAI Gym提供了这些开箱即用的环境: Classic controlToy textAlgorithmicAtari (基于 Arcade学习环境 )、 棋盘游戏2D/3D机器人 (最后一项需要一个 MuJoCo 物理引擎许可。)

目前,OpenAI Gym在Linux和OSX上支持Python 2.7。如果大家有足够的兴趣,他们也会考虑支持Python 3和Windows。该工具集的代码遵循MIT许可协议。

查看英文原文: Open Sourcing Artificial Intelligence Research

我来评几句
登录后评论

已发表评论数()

相关站点

+订阅
热门文章