专栏名称: AI科技评论
「AI科技评论」是国内顶尖人工智能媒体和产业服务平台,专注全球 AI 业界、学术和开发三大方向的深度报道。
目录
今天看啥  ›  专栏  ›  AI科技评论

动作和场景不必紧紧绑定,减轻场景偏差,便能轻松识别商场跳舞 球场唱歌

AI科技评论  · 公众号  · AI  · 2020-02-28 00:20
    

文章预览

作者 | 姜蔚蔚 编辑 | 贾伟 过去几年,卷积神经网络(CNN)在视频中的动作识别问题上取得了巨大的进展。然而,这些方法往往会过于关注背景中的场景,而忽视了具体的动作本身。如图1所示,尽管人类的动作在图片中被屏蔽了,我们仍然能够通过场景来推断出最有可能的动作类型。对于卷积神经网络模型而言,通过识别场景来给出动作的类型就不可避免地带上了场景偏差。 图1. 尽管看不到人影,我们仍然能够通过场景来推断具体动作。 这种场景偏差在一些情况下会导致模型产生我们不希望看到的效果。如图2所示,左图中,由于棒球场的背景,唱歌的人会被错误地预测为在打棒球,而在右图中,即使我们把游泳的人完全挡住,模型也会由于对游泳池背景的识别,给 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览