今天看啥  ›  专栏  ›  自动驾驶Daily

分享一下我强化学习的工作:Simple Policy Optimization

自动驾驶Daily  · 公众号  ·  · 2024-11-27 07:30
    

文章预览

作者 | Flange  编辑 | 自动驾驶Daily 原文链接:https://zhuanlan.zhihu.com/p/687342242 点击下方 卡片 ,关注“ 自动驾驶Daily ”公众号 戳我->  领取近15个自动驾驶方向路线 >> 点击进入→ 自动驾驶Daily技术交流群 本文只做学术分享,如有侵权,联系删文 ,自动驾驶课程学习与技术交流群事宜,也欢迎添加小助理微信AIDriver004做进一步咨询 关于SPO的视频介绍已上传至B站,地址:介绍一下我强化学习的工作:Simple Policy Optimization (SPO)_哔哩哔哩_bilibili 以下是补充完整的原文。 本人目前双非大四准备考研中,大学期间主要在学强化学习,2024年初有了这个idea,所以尝试了一下发现效果还不错,因此写了一篇论文,正好毕业论文也解决了,在此记录一下。原文:[2401.16025] Simple Policy Optimization (arxiv.org),代码:GitHub - MyRepositories-hub/Simple-Policy-Optimization。 当然,23年底 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览