今天看啥  ›  专栏  ›  机器之心

学界 | 斯坦福联合Facebook创建CLEVR:用于组合式语言和初级视觉推理的诊断数据集

机器之心  · 公众号  · AI  · 2016-12-23 11:27
选自arXiv.org机器之心编译参与:吴攀论文:CLEVR:一个用于组合式语言和初级视觉推理的诊断数据集(CLEVR: A Diagnostic Dataset for Compositional Language and Elementary Visual Reasoning)摘要:当开发能够推理和回答关于视觉数据的问题的人工智能系统时,我们需要诊断测试来分析我们的进展和发现缺陷。现有的一些视觉问答基准可以提供帮助,但它们有很强的偏置(bias)——模型可以利用这些偏置从而无需推理就能给出问题的正确答案。它们还混有多个误差源,这会让我们难以定位模型的弱点。我们提出了一个诊断数据集,其可以测试许多视觉推理能力。它包含了最小的偏置,并且有详细的标注描述了每个问题所需的推理的类型。我们使用这个数据集分析了各种现代的视觉推理系统 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照