看啥推荐读物
一个有情怀的公众号。机器学习、自然语言处理、算法等知识集中营、期待与你相遇~
今天看啥  ›  专栏  ›  机器学习算法与自然语言处理

最强数据集50个最佳机器学习公共数据,可以帮你验证idea!

机器学习算法与自然语言处理  · 公众号  ·  · 2018-11-11 00:00
原作 mlmemoirs 郭一璞 编译 量子位 报道 | 公众号 QbitAI外国自媒体mlmemoirs根据github、福布斯、CMU官网等信息,整理了一张50个最佳机器学习公共数据集的榜单,量子位为大家分享一下~提前说两个须知:1.  寻找数据集の奥义根据CMU的说法,寻找一个好用的数据集需要注意一下几点:数据集不混乱,否则要花费大量时间来清理数据。数据集不应包含太多行或列,否则会难以使用。数据越干净越好,清理大型数据集可能非常耗时。应该预设一个有趣的问题,而这个问题又可以用数据来回答。2.  去哪里找数据集Kaggle:爱竞赛的盆友们应该很熟悉了,Kaggle上有各种有趣的数据集,拉面评级、篮球数据、甚至西雅图的宠物许可证。https://www.kaggle.com/UCI机器学习库:最古老的数据 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照