今天看啥  ›  专栏  ›  kaggle竞赛宝典

从银牌到Top5的Kaggle骚操作。

kaggle竞赛宝典  · 公众号  ·  · 2021-11-12 23:58
↑↑↑关注后"星标"kaggle竞赛宝典 kaggle竞赛宝典技巧作者:RSJ & 杰少 三大黄金数据扩充技巧简介在Kaggle Google Brain序列大赛中,第三名的选手在特征工程的基础上融入三种数据扩充策略大大提升了模型的预测效果,直接从银牌外的分数冲进了前五,究竟是哪三种数据扩充策略呢?今天我们一起来学习研究一下Top选手的秘密:Masking扩充策略;Shuffling扩充策略;Mixup扩充策略;三大数据扩充策略01 Masking扩充Masking的策略,在很多问题中就会被使用,有点类似于剪切,在Google Brain中作者在R和C上随机进行Masking。此处主要考虑到u_In这样的数字在EDA时发现其与压力的相关性很高,通过故意删除类型信息,再对模型进行了训练,可以让模型去理解u_In的一般语义。one_sample = get_sample(idx)# ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照