专栏名称: 机器学习研究会
机器学习研究会是北京大学大数据与机器学习创新中心旗下的学生组织,旨在构建一个机器学习从事者交流的平台。除了及时分享领域资讯外,协会还会举办各种业界巨头/学术神牛讲座、学术大牛沙龙分享会、real data 创新竞赛等活动。
目录
今天看啥  ›  专栏  ›  机器学习研究会

【学习】大白话解释模型产生过拟合的原因

机器学习研究会  · 公众号  · AI  · 2017-04-01 19:36
    

文章预览

点击上方 “机器学习研究会” 可以订阅哦 摘要   转自:自然语言处理与机器学习 过拟合的概念? 首先我们来解释一下过拟合的概念? 过拟合就是训练出来的模型在训练集上表现很好,但是在测试集上表现较差的一种现象!下图给出例子: 我们将上图第三个模型解释为出现了过拟合现象,过度的拟合了训练数据,而没有考虑到泛化能力。在训练集上的准确率和在开发集上的准确率画在一个图上如下: 从图中我们能够看出,模型在训练集上表现很好,但是在交叉验证集上表现先好后差。这也正是过拟合的特征! 模型出现过拟合现象的原因 发生过拟合的主要原因可以有以下三点: (1)数据有噪声 (2)训练数据不足,有限的训 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览