注册登录

看啥推荐读物

专栏名称: HuggingFace

The AI community building the future.

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

知乎回答RSS订阅方法

知乎专栏 RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

自贡网 · 自贡—北京 10小时30分钟！安排~· 昨天

自贡网 · 执行！坚决维护军人军属合法权益· 4 天前

自贡网 · 创建双拥模范城自贡这样做——· 4 天前

自贡网 · 已招引企业16户！· 4 天前

自贡网 · 痛别！“巴蜀鬼才”魏明伦病逝· 6 天前

今天看啥 › 专栏 › HuggingFace

社区供稿 | Unsloth 微调 Llama3-8B，提速 44.35%，节省 42.58% 显存，最少仅需 7.75GB

HuggingFace · 公众号 · · 2024-05-08 18:30

01前言本文主要介绍Unsloth，它可以显著提升大模型的训练速度，减少显存占用，我们将其整合到Firefly训练框架中，实现对Llama3、Llama2、Mistral、Gemma、Zephyr等模型训练的「降本增速」。我们实测了Unsloth所带来的训练增益，对Llama3-8B进行QLoRA训练，最少仅需7.75GB显存，这意味着我们可以在一张1080Ti上训练Llama3-8B，进一步降低了大模型训练的硬件门槛。开启Unsloth后，Llama3-8B的训练速度可提升44.35%，训练时间可减少30.72%，显存占用可减少42.58%。更详细的测试设置可参考第三节。Firefly项目链接：https://github.com/yangjianxin1/FireflyUnsloth项目链接：https://github.com/unslothai/unsloth02Unsloth简介Unsloth是一个开源的大模型训练加速项目，使用OpenAI的Triton对模型的计算过程进行重写，大幅提升模型的训练速度，降低训练中的显存占用。Unsloth能够保证重写后的模型计算的一致性 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照

分享到微博

推荐文章

自贡网 · 自贡—北京 10小时30分钟！安排~

昨天

自贡网 · 执行！坚决维护军人军属合法权益

4 天前

自贡网 · 创建双拥模范城自贡这样做——

4 天前

自贡网 · 已招引企业16户！

4 天前

自贡网 · 痛别！“巴蜀鬼才”魏明伦病逝

6 天前

TeacherGwen · 每日听写 | 8.25

9 月前

招商研究 · 招商研究 | 招闻天下1203

2 年前

益链科技 · 天津理工大学副教授李宝珠：智慧化工园区供应链金融生态联盟链

4 年前

中国证券网 · 避雷指南：这份外资持股名单或许对你有帮助

5 年前

智能建筑电气技术杂志 · 【IBE】《人民日报》公布的这些“撞脸”汉字，你都认识吗？

6 年前

关于移动版 · Py中国 · RSS之家 · codingpro · Code · link之家 · 卧龙AI搜索 · 藏经阁 · 小百科

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号