看啥推荐读物
专栏名称: 计算机视觉工坊
专注于计算机视觉、VSLAM、目标检测、语义分割、自动驾驶、深度学习、AI芯片、产品落地等技术干货及前沿paper分享。这是一个由多个大厂算法研究人员和知名高校博士创立的平台,我们坚持工坊精神,做最有价值的事~
今天看啥  ›  专栏  ›  计算机视觉工坊

CVPR 2022数据集汇总|包含目标检测、多模态等方向

计算机视觉工坊  · 公众号  ·  · 2022-04-19 07:00
编辑丨极市平台M5Product Dataset论文地址:https://arxiv.org/abs/2109.04275数据集地址:https://xiaodongsuper.github.io/M5Product_dataset/index.htmlM5Product 数据集是一个大规模的多模态预训练数据集,具有针对电子产品的粗粒度和细粒度注释。600 万个多模态样本、5k个属性和2400 万个值5 种模式-图像 文本 表 视频 音频600 万个类别注释,包含6k个类别广泛的数据源(100 万商户提供)Ego4D论文地址:https://arxiv.org/abs/2110.07058数据集地址:https://ego4d-data.org/在全球 74 个地点和 9 个国家/地区收集的大规模、以自我为中心的数据集和基准套件,包含超过 3,670 小时的日常生活活动视频。使用七种不同的现成头戴式摄像机捕获数据:GoPro、Vuzix Blade、Pupil Labs、ZShades、OR-DRO EP6、iVue Rincon 1080 和 Weeview。除了视频,部分 Ego4D 还提供其他数据模式:3D 扫描、音频、凝视、立体、多个 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照