小白学大模型：LoRA原理与后续改进

Coggle数据科学 · 公众号 · · 2024-03-15 14:55

低秩适应（Low-Rank Adaptation，LoRA）可以被认为是一项重大突破，它能够有效地训练大型语言模型以执行特定任务。如今，它在许多应用中被广泛使用，并且已经激发了研究如何改进其主要思想以实现更好性能或更快速地训练模型的工作。在本文中，我将概述一些LoRA的变体，这些变体以不同的方式改进LoRA的能力。我将首先解释LoRA本身的基本概念，然后介绍LoRA+、VeRA、LoRA-FA、LoRA-drop、AdaLoRA、DoRA和Delta-LoRA。unsetunsetLoraunsetunsetLoRA: Hu, E. J., Shen, Y., Wallis, P., Allen-Zhu, Z., Li, Y., Wang, S., … & Chen, W. (2021). Lora: Low-rank adaptation of large language models. arXiv preprint arXiv:2106.09685.Low-Rank Adaption (LoRA) 如今被广泛用于训练大型语言模型（LLMs）。大型语言模型具有预测自然语言输入的标记的能力。这是一项令人惊讶的能力，但对于解决许多问题来说，这还不够。大多数情况下， ………………………………

原文地址：访问原文地址
快照地址：访问文章快照

分享到微博

推荐文章

营商电动车 · 销量暴涨，渠道爆扩！五星钻豹精准营销赋能旺季，湘潭战区一路领跑

8 月前

青苗法鸣 · 行政法学研究会会员大会暨2023年年会预通知

9 月前

广东民生DV现场 · 最新！苏炳添发烧，取消比赛

1 年前

译言 · 急招｜【一时瓣课】新媒体及活动运营负责人

3 年前

艺空间 · 法国人用深海900米的海水做喷雾，搞好了我10年老鼻炎！

5 年前