专栏名称: 麻省理工科技评论
《麻省理工科技评论》杂志官方微博 源自麻省理工学院,关注即将商业化的创新,聚焦即将资本化的创业。
目录
今天看啥  ›  专栏  ›  麻省理工科技评论

【适用于GPU资源受限的部署环境,研究人员提出AI模型无损压缩框-20250422185457

麻省理工科技评论  · 微博  ·  · 2025-04-22 18:54
    

文章预览

2025-04-22 18:54 本条微博链接 【适用于GPU资源受限的部署环境,研究人员提出AI模型无损压缩框架,压缩率达70%】 #大模型# 被压缩 30% 性能仍与原模型一致,既能兼容 GPU 推理、又能减少内存和 GPU 开销、并且比 #英伟达# nvCOMP 解压缩快 15 倍。 这便是美国 #莱斯大学# 博士生张天一和合作者打造的无损压缩框架 DFloat11 所拥有的“本领”。 研究中,他们针对包括 Llama-3.1、Qwen-2.5 和 Gemma-3 在内的最新模型进行了实验,借此证 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览