专栏名称: ArronAI

专注于AI算法，尤其是前沿算法的理论和实践，包括GAN网络、强化学习、迁移学习、数据挖掘、机器学习、深度学习，推荐系统的相关论文分享和代码解读，欢迎AI爱好者加入，互相学习，共同进步，为加速AI发展事业贡献自己的一份力。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

【解读】中文大语言模型-LLaMA技术报告

ArronAI · 公众号 · · 2023-11-14 18:47

文章预览

EFFICIENT AND EFFECTIVE TEXT ENCODING FOR CHINESE LL AMA AND ALPACA https://arxiv.org/pdf/2304.08177v1.pdf https://github.com/ymcui/Chinese-LLaMA-Alpaca Part1 介绍我们通过在原有的LLaMA词汇中增加20,000个中文符号来提高中文编码和解码的效率，并提高LLaMA的中文理解能力。我们采用低秩适应（LoRA）的方法来有效地训练和部署中国的LLaMA和Alpaca模型，使研究人员能够在不产生过多计算成本的情况下使用这些模型。我们评估了中国羊驼7B和13B模型在各种自然语言理解（NLU）和自然语言生成（ NLG）任务中的表现，表明在中文语言任务中比原来的LLaMA对应模型有明显的改进。我们公开了我们的研究资源和结果，促进了NLP社区的进一步研究和合作，并鼓励将LLaMA和Alpaca模型改编为其他语言。 Part2 CHINESE LLAMA 针对于中文而言，LLaMA存在的问题： LLaMA标记器的原始词汇中只有不到一千个中文字符。 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博