【泡泡一分钟】通过少量示教中学习奖励

泡泡机器人SLAM · 公众号 · 机器人 · 2023-04-05 06:30

文章预览

每天一分钟，带你读遍机器人顶级会议文章标题：Reward Learning From Very Few Demonstrations 作者： Cem Eteke, Dogancan Kebude, and Baris Akgun 来源：2021 IEEE International Conference on Robotics and Automation (ICRA 2021) 编译：骆子云审核：Zoe 这是泡泡一分钟推送的第 994 篇文章，欢迎个人转发朋友圈；其他机构或自媒体如需转载，后台留言申请授权摘要本文介绍了一种新型技能学习框架，这种框架可以通过少量示教学习奖励，并将其用在策略搜索（PS）中，从而提升技能。示教被用于学习执行技能所用到的参数化策略，和作为隐式马尔科夫模型（HMM）的目标模型，从而监测执行。奖励则从隐式马尔科夫模型结构和其检测能力习得。马尔科夫模型被转化成有限时间的马尔科夫奖励过程（MRP），并用蒙特卡洛方法计算结果。然后，将HMM和上述结果合并到一个部分可观测的MRP中， ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

sundanjian · 七年级下册历史知识点总结

1 年前

万联证券研究所 · 【万联电子丨行业快评】广东省推动AI赋能千行百业，加快智能经济发展

11 月前

环球律师事务所 · 直播提醒 | 上市公司重组的支付工具与配套融资

11 月前

安全茂 · 通报：企业未建立双重预防机制被罚！法律规定由一把手亲自负责！

10 月前

财宝宝 · 不能这样看。我没有连播的意思。-20240812122351

9 月前