今天看啥  ›  专栏  ›  InfoQ

最近三年失败了两万个机器学习项目,原因主要有九个

InfoQ  · 公众号  · 科技媒体  · 2018-09-18 08:31
作者 | Alberto Artasanchez 译者 | 刘志勇 编辑 | Debra-AI 前线 1 提出错误的问题 如果你提错了问题,那么你得到的答案肯定是错误的。金融行业和欺诈识别问题就是这样的一例。本来嘛,最初提出的问题可能是“这笔特定的交易是否存在欺诈?”。如果想要确认是不是存在这个问题,你就需要一个包含欺诈和非欺诈交易示例的数据集。而这个数据集很有可能就是人工帮助下生成的,也就是说,这个数据集里的数据标记可以由专门负责检测欺诈行为的主题专家(subject matter experts,SME)来决定。但是,专家很有可能使用他们以前所见过的欺诈行为来标记数据集,这样一来,用这种数据集对模型进行训练,模型将只会捕获所标记的老旧模式的欺诈行为。如果犯罪分子发 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照