注册
登录
看啥推荐读物
专栏名称:
机器之心
专业的人工智能媒体和产业服务平台
我也要提交微信公众号
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
知乎回答RSS订阅方法
知乎专栏 RSS订阅方法
雪球动态RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
豆瓣日记 RSS订阅方法
目录
相关文章推荐
爱可可-爱生活
·
【AlwaysReddy:使用热键控制的简约 ...
·
昨天
黄建同学
·
Google DeepMind ...
·
3 天前
爱可可-爱生活
·
【Elon Musk 称赞 Meta 的 ...
·
3 天前
爱可可-爱生活
·
通过归纳文本与情感的因果机制,指导构建对齐的 ...
·
3 天前
宝玉xp
·
//@雪夜怪谈:提到的文明系列书单在这:网页 ...
·
6 天前
今天看啥
›
专栏
›
机器之心
NIPS 2018 | Spotlight论文:凭借幻想的目标进行视觉强化学习
机器之心
·
公众号
·
AI
· 2018-10-19 11:36
选自bair.Berkeley作者:Vitchyr Pong、 Ashvin Nai机器之心编译参与:乾树、王淑婷为了让智能体在测试时自动实现用户指定的广泛目标,它必须能够学习广泛适用的通用技能。此外,为了提供必要的通用性,这些技能必须处理原始的传感输入,如图像。在本文中,作者提出了一种算法,通过结合无监督表征学习和目标条件策略的强化学习来获得这种通用技能。我们想构建一个能够在复杂的非结构化环境中完成任意目标的智能体,例如可以做家务的机器人。一种有前景的方法是使用深度强化学习,这是一种用于教授智能体最大化奖励函数的强大框架。然而,典型的强化学习范例一般需要手动设计奖励函数来训练智能体解决独立任务。例如,你可以通过设计奖励函数来训练机器 ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
分享到微博
推荐文章
爱可可-爱生活
·
【AlwaysReddy:使用热键控制的简约 AI 助手】’Al-20240423135820
昨天
黄建同学
·
Google DeepMind 研究人员分享了其低成本 ALOH-20240421180421
3 天前
爱可可-爱生活
·
【Elon Musk 称赞 Meta 的 Llama 3 AI,-20240421073412
3 天前
爱可可-爱生活
·
通过归纳文本与情感的因果机制,指导构建对齐的因果提示以改进语言模-20240421060550
3 天前
宝玉xp
·
//@雪夜怪谈:提到的文明系列书单在这:网页链接 “文明”乌托-20240418143223
6 天前
鸿洋
·
Android 冷知识,我要被 GC 了...
2 年前
南国早报
·
老师拖堂导致学生肥胖?青少年减肥新规出台,南宁家长老师热议
3 年前
有车以后
·
每公里不到3毛钱!这款合资B级车,一箱油可以跑1000km!
5 年前
懒人在思考
·
为小团队自由上网做个准备
6 年前
医药魔方
·
上海药交会,逛累了就来医药魔方休息区坐坐吧
6 年前