今天看啥  ›  专栏  ›  OSC开源社区

快过HugeCTR:用OneFlow轻松实现大型推荐系统引擎

OSC开源社区  · 公众号  · 程序员  · 2021-02-24 22:00
喜欢就关注我们吧!一、简介Wide & Deep Learning (以下简称 WDL)是解决点击率预估(CTR Prediction)问题比较重要的模型。WDL 在训练时,也面临着点击率预估领域存在的两个挑战:巨大的词表(Embedding Table),以及大量的数据吞吐。业界比较有影响力的包含了 WDL 解决方案及评测结果的项目有 HugeCTR[1],该框架通过模型并行、三级流水线等技巧,解决了以上问题。在2020年 MLPerf [2]评测中,英伟达用 HugeCTR 实现了当时最快的 WDL 模型。英伟达 Blog[3] 给出的数据显示,在特定的、对齐后的硬件条件下,HugeCTR 的速度是 TensorFlow-CPU 的114倍,是 TensorFlow-GPU 的7.4倍,下图的纵坐标代表每轮迭代的延迟,数值越小,意味着性能越好:而 OneFlow-WDL 比 HugeCTR 更快,每轮迭代延迟比 HugeCTR ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照