看啥推荐读物
一个有情怀的公众号。机器学习、自然语言处理、算法等知识集中营、期待与你相遇~
目录
相关文章推荐
今天看啥  ›  专栏  ›  机器学习算法与自然语言处理

又一个158万张图像的鉴黄数据集!我还有一个想法……

机器学习算法与自然语言处理  · 公众号  ·  · 2019-02-15 08:52
来自 | 机器之心(禁止二次转载)如果你想训练一个内容审核系统过滤不合适的信息,或用 GAN 实现一些大胆的想法,那么数据集是必不可少的。但限制级图像很难收集,也很少会开源。在这个项目中,作者构建了一个大型高质量图像鉴黄数据集,它有超过 158 万张图像,共分为 159 个大类别,且每一个类别还有若干子类别。另外,今天发这篇文章和情人节完全无关,和你是不是单身狗完全无关,一切是为了探索机器学习的前沿……(笑眯眯手动摸狗头)。项目地址:https://github.com/EBazarov/nsfw_data_source_urls上个月我们介绍了一个有 22万张NSFW图片的鉴黄数据集的 GitHub 项目(nsfw_data_scrapper),仅分为 5 个类别。这个项目不同类别之间的距离并不是很明显,且有很多图像存在 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照