看啥推荐读物
专栏名称: 数据派THU
本订阅号是“THU数据派”的姊妹账号,致力于传播大数据价值、培养数据思维。
今天看啥  ›  专栏  ›  数据派THU

独家|一文解读合成数据在机器学习技术下的表现

数据派THU  · 公众号  · 大数据  · 2018-08-20 19:00
作者:Eric Le Fort翻译:蒋雨畅校对:卢苗苗本文约3200字,建议阅读12分钟。本文将通过介绍两个分布模型,并运用它们到合成数据过程中,来分析合成数据在不同机器学习技术下的表现。想法 相比于数量有限的“有机”数据,我将分析、测评合成数据是否能实现改进。 动机 我对合成数据的有效性持怀疑态度——预测模型只能与用于训练数据的数据集一样好。这种怀疑论点燃了我内心的想法,即通过客观调查来研究这些直觉。 需具备的知识 本文的读者应该处于对机器学习相关理论理解的中间水平,并且应该已经熟悉以下主题以便充分理解本文:基本统计知识,例如“标准差”一词的含义熟悉神经网络,SVM和决策树(如果您只熟悉其中的一个或两个,那可能就行了 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照