每天一分钟,带你读遍机器人顶级会议文章标题:Query-guided Regression Network with Context Policy for Phrase Grounding作者:Kan Chen, Rama Kovvuri, Ram Nevatia来源:International Conference on Computer Vision (ICCV 2017)播音员:amy编译:陈诚(86)欢迎个人转发朋友圈;其他机构或自媒体如需转载,后台留言申请授权摘要 描述定位指的是根据对一张图像的语言描述来定位到被描述的物体。目前的方法在解决这个问题的时候是依据关联程度来对一系列提议或者推荐进行排序,这样使得算法最终受限于这些独立的推荐系统的表现并且也从描述中忽略了有用的信息。本文用空间回归的方法来突破这方面的限制,并且提出一种增强学习的方法利用语义信息。我们提出方法是一种全新的基于索引指导的回归
………………………………