大型语言模型的模型压缩与高效推理：综述

专知 · 公众号 · · 2024-02-17 14:00

文章预览

基于Transformer的大型语言模型取得了巨大成功。然而，在推理过程中产生的显著内存和计算成本，使得在资源受限的设备上部署大型模型变得具有挑战性。在本文中，我们从算法角度调查了大型语言模型的压缩和高效推理方法。就分类而言，类似于较小的模型，大型语言模型的压缩和加速算法仍可以分为量化、剪枝、蒸馏、紧凑架构设计、动态网络。然而，与较小模型相比，大型语言模型有两个突出的特点：（1）大多数压缩算法在压缩后需要进行微调甚至重新训练模型。大型模型最显著的方面是与模型微调或训练相关的非常高成本。因此，许多针对大型模型的算法，如量化和剪枝，开始探索无需调整的算法。（2）大型模型强调的是通用性和泛化能力，而不是在单一任务上的性能。因此，许多算法，如知识蒸馏，关注于如何在压缩后保持其通 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

长沙房研社 · 第二个观宸？开福中心又一纯住宅地块调规！

13 小时前

亿邦动力 · 古良吉吉创始人古良：如何用情绪价值重构用户关系?｜马蹄友局笔记

20 小时前

财宝宝 · //@财饰界:牛呀//@财端端:发现一招儿有用：下载微博轻享版，-20250424224256

昨天

亿邦动力 · 京东外卖日单量破1000万单；腾讯全域支持投放微信小店直购链路；TikTok Shop巴西站将于5月8日正式运营丨CEO自习室

昨天

财宝宝 · 如果你觉得压力太大，就不要考虑别人感受，放飞自我。-20250424135223

昨天

火星研究社 · 马桶自动清洁神器！杀菌清洁去异味，一年换一次，再也不用刷马桶~

6 月前

话匣子 · 太揪心！1岁宝宝4根手指竟被切成7段，仅1/8皮肤相连……

3 月前

话匣子 · 太揪心！1岁宝宝4根手指竟被切成7段，仅1/8皮肤相连……

3 月前

看看新闻Knews · “感觉全世界的人都在这！”凌晨3点已人山人海

2 月前

无城网 · 无为市投资促进发展有限公司2025年招聘公告

2 月前