今天看啥  ›  专栏  ›  机器之心

ICLR 2018 | 清华&斯坦福提出深度梯度压缩DGC,大幅降低分布式训练网络带宽需求

机器之心  · 公众号  · AI  · 2018-03-15 12:01
选自arXiv作者:林宇鋆、韩松等机器之心编译参与:刘晓坤来自清华大学和斯坦福大学的研究者们发现,分布式随机梯度下降训练中 99.9% 的梯度交换都是冗余的——通过他们提出的深度梯度压缩(DGC)方法,神经网络训练可以大幅降低通信带宽需求。在多个基准模型上的对比实验表明,该方法可以在不降低准确率的情况下达到 270 倍到 600 倍的梯度压缩率,使得小带宽甚至移动设备上的大规模分布式训练变为可能。作者简介林宇鋆是清华大学电子工程系 NICS 实验室 2014 级本科生,于 2017 年暑假在斯坦福参加暑研期间同韩松博士一起出色完成了 DGC 的工作,收到 MIT, Stanford, CMU, UMich 等美国名校的博士项目录取,并将于 2018 年秋加入 MIT HAN Lab 攻读博士学位。韩松博士于 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照