专栏名称: 泡泡机器人SLAM
SLAM的最新资讯,干货内容。
目录
相关文章推荐
今天看啥  ›  专栏  ›  泡泡机器人SLAM

【泡泡一分钟】通过少量示教中学习奖励

泡泡机器人SLAM  · 公众号  · 机器人  · 2023-04-05 06:30
    

文章预览

每天一分钟,带你读遍机器人顶级会议文章 标题:Reward Learning From Very Few Demonstrations 作者: Cem Eteke, Dogancan Kebude, and Baris Akgun 来源:2021 IEEE International Conference on Robotics and Automation (ICRA 2021) 编译:骆子云 审核:Zoe 这是泡泡一分钟推送的第 994 篇文章,欢迎个人转发朋友圈;其他机构或自媒体如需转载,后台留言申请授权 摘要 本文介绍了一种新型技能学习框架,这种框架可以通过少量示教学习奖励,并将其用在策略搜索(PS)中,从而提升技能。示教被用于学习执行技能所用到的参数化策略,和作为隐式马尔科夫模型(HMM)的目标模型,从而监测执行。奖励则从隐式马尔科夫模型结构和其检测能力习得。马尔科夫模型被转化成有限时间的马尔科夫奖励过程(MRP),并用蒙特卡洛方法计算结果。然后,将HMM和上述结果合并到一个部分可观测的MRP中, ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览