选自OpenAI作者: CHRISTOPHER HESSE等机器之心编译参与:李亚洲、刘晓坤近日,OpenAI 发布了一个迁移学习竞赛,来评判强化学习算法从先前经验进行泛化的能力。在典型的强化学习研究中,算法的测试与训练环境是一样的,这对于记忆能力更好以及有很多超参数的算法来说更有优势。而 OpenAI 发布的这个竞赛是在先前未见过的视频游戏上测试算法。此外,该竞赛使用的是 OpenAI 将经典游戏融入到 Gym 中做出的新平台 Gym Retro。竞赛地址:https://contest.openai.com/Gym Retro 的 GitHub 地址:https://github.com/openai/retroOpenAI Retro 竞赛给出了在《刺猬索尼克》系列游戏上的多级别训练集,然后在 OpenAI 定义级别的测试集上评估算法。这里有两个机密测试集:一个用于在竞赛进行的时候竞争
………………………………