看啥推荐读物
专栏名称: 深蓝学堂EDU
深蓝学院是专注于前沿科技的在线教育平台,为广大在校大学生、IT从业者、科研人员提供系统的前沿科技教育和咨询等服务。深蓝学院关注人工智能、机器人、增强现实等黑科技。
今天看啥  ›  专栏  ›  深蓝学堂EDU

4场公开课!揭秘大模型压缩技术的创新之旅

深蓝学堂EDU  · 公众号  ·  · 2024-04-17 18:10
大模型时代,模型参数量动辄百亿,甚至千亿,比如GPT-3的参数量达到了1750亿。1750亿个参数,如果采用fp16存储,那么模型的大小约为325.5G。现有最强的计算平台也很难满足其显存要求。因此,模型“瘦身”已经成了工业界必要的技术,只不过它有一个更正式的名字,叫模型压缩。模型压缩技术通过量化或者稀疏等方法,把深度神经网络模型以更高效的方式进行部署。可以说,当下各类大语言模型、扩散模型、多模态大模型的实际部署上线,都离不开模型压缩。聊到模型压缩技术,就不得不提商汤科技模型工具链团队,作为国内企业界实力最强的工具链团队之一,支撑了商汤科技内部多个产品线的模型上线。本次,深蓝学院联合商汤科技模型工具链团队,共同举办“大模型工具体系”系列公开课,邀请到了CVPR、ICLR、AAAI等顶尖学术会议的杰出作者 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照