看啥推荐读物
专栏名称: 谷歌开发者
Google中国官方账号。汇集Android, Chrome, Angular等移动和网络开发技术、Google Play和AdMob等开发者成长、优化和变现平台。
今天看啥  ›  专栏  ›  谷歌开发者

推出 RxR:多语言指令跟随导航基准数据集

谷歌开发者  · 公众号  · 科技媒体  · 2021-02-02 17:01
文 / Alexander Ku,软件工程师和 Peter Anderson,研究员,Google Research机器学习 (ML) 的一项核心挑战是构建能够在复杂的实际环境中导航,并对口头或书面命令做出响应的代理 (Agents)。虽然如今的代理,包括机器人,通常可以在复杂的环境中导航,但它们还不能理解使用自然语言表达的导航目标,例如,“穿过右侧关闭的棕色双开门,然后站在椅子后面与桌子前面。”这一挑战被称为视觉-语言导航 (Vision-and-Language Navigation, VLN),它需要对空间语言有深刻的理解。例如,要想识别“椅子后面与桌子前面” 的位置,就需要找到桌子,识别桌子的哪一部分被认为是前侧,找到离桌子前侧最近的椅子,识别这把椅子后面的区域,等等。虽然人们可以轻松理解并遵从上述这类指令,但 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照