专栏名称: 将门创投
将门是一家专注于发掘及加速技术创新激活商业价值的创业公司的创投机构。将门旗下设有将门创新服务、将门技术社群以及将门投资基金。关注领域包括机器智能、物联网、自然人机交互、企业计算。
今天看啥  ›  专栏  ›  将门创投

改变LoRA的初始化方式就能显著提升微调效果

将门创投  · 公众号  · 科技创业  · 2024-05-15 07:12
随着大模型的参数量日益增长,微调整个模型的开销逐渐变得难以接受。为此,北京大学人工智能研究院张牧涵团队论文PiSSA: Principal Singular Values and Singular Vectors Adaptation of Large Language Models,提出了一种名为PiSSA的参数高效微调方法,在主流数据集上都超过了目前广泛使用的LoRA、QLoRA的微调效果。北京大学人工智能研究院博士生孟繁续为论文第一作者,人工智能研究院助理教授张牧涵为通讯作者。论文标题:PiSSA: Principal Singular Values and Singular Vectors Adaptation of Large Language Models论文链接:https://arxiv.org/pdf/2404.02948.pdf代码链接: https://github.com/GraphPKU/PiSSA一、PiSSA:一种参数高效微调方法如图1所示,PiSSA(图1c)在模型架构上和LoRA[1]完全一致(图1b),只是初始化Adapter的方式不同。LoRA使用高斯噪声初始化,使用初始化。而PiSSA使用主奇异值和奇异向量(Principal Singu ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照