社区供稿 | 使用 Firefly 在单卡V100 上对 Qwen1.5 进行 SFT 和 DPO，显著超越官方模型

HuggingFace · 公众号 · · 2024-03-08 22:29

01简介Firefly 是开源的大模型一站式训练框架，支持对各种大模型进行预训练、指令微调、DPO，支持全量参数、LoRA、QLoRA 等训练方式。支持包括但不限于 Gemma、Qwen1.5、MiniCPM、Mixtral-8x7B、Mistral、Llama 等绝大多数主流的大模型。项目链接：https://github.com/yangjianxin1/Firefly模型权重：https://hf.co/YeungNLP/firefly-qwen1.5-en-7bhttps://hf.co/YeungNLP/firefly-qwen1.5-en-7b-dpo-v0.1本文将分享我们使用 Firefly 项目对 Qwen1.5-7B 进行训练的实验。我们对训练数据进行精细化筛选，然后在单张 V100 上进行 SFT 和 DPO。经过两阶段的训练，我们的模型在 Open LLM Leaderboard 上的表现显著优于官方的 Qwen1.5-7B-Chat、Gemma-7B-it、Vicuna-13B 等模型。比 Qwen1.5-7B-Chat 高 7.12 分，比 Gemma-7B-it 高 8.8 分。通义千问 Qwen1.5 是阿里巴巴在春节前开源的大模型，支持 32K 的上下文长度，该模型本质上是 Qwen2 的 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照

分享到微博

推荐文章

笔吧评测室 · 2024 款惠普战 X 锐龙版笔记本开售：R7 8840HS + 16GB + 1TB 售 5299 元

4 天前

笔吧评测室 · 江波龙展示 FORESEE LPCAMM2 笔记本内存：最高 64GB、7500MT/s

4 天前

笔吧评测室 · 英特尔 N250 低功耗处理器曝光：4 核 4 线程，1.2 GHz 频率

5 天前

笔吧评测室 · 华为 MateBook X Pro 笔记本新增“拂晓粉”配色，顶配 15699 元

5 天前

笔吧评测室 · ThinkPad P14s Gen 5 笔记本发布：锐龙 PRO 8040、双内存插槽、可选 5G 网络

6 天前

FashionWeek · “代资入圈”的她，终于出头了？

7 月前

OFweek维科网 · 近三年IPO筹划终止！火炬电子已撤回子公司分拆上市申请

10 月前

上海证券报 · 科创板、深市公司三季报披露时间表出炉，绩优公司率先交答卷

3 年前

冲蒌老伍 · 讲大话唔眨眼，被靓女识穿好尴尬

4 年前

为了理解而教和学 · 学位教育和术科教育都学什么？

5 年前