专栏名称: ArronAI
专注于AI算法,尤其是前沿算法的理论和实践,包括GAN网络、强化学习、迁移学习、数据挖掘、机器学习、深度学习,推荐系统的相关论文分享和代码解读,欢迎AI爱好者加入,互相学习,共同进步,为加速AI发展事业贡献自己的一份力。
今天看啥  ›  专栏  ›  ArronAI

【解读】中文大语言模型-LLaMA技术报告

ArronAI  · 公众号  ·  · 2023-11-14 18:47

文章预览

EFFICIENT AND EFFECTIVE TEXT ENCODING FOR CHINESE LL AMA AND ALPACA https://arxiv.org/pdf/2304.08177v1.pdf https://github.com/ymcui/Chinese-LLaMA-Alpaca Part1 介绍 我们通过在原有的LLaMA词汇中增加20,000个中文符号来提高中文编码和解码的效率,并提高LLaMA的中文理解能力。 我们采用低秩适应(LoRA)的方法来有效地训练和部署中国的LLaMA和Alpaca模型,使研究人员能够在不产生过多计算成本的情况下使用这些模型。 我们评估了中国羊驼7B和13B模型在各种自然语言理解(NLU)和自然语言生成( NLG)任务中的表现,表明在中文语言任务中比原来的LLaMA对应模型有明显的改进。 我们公开了我们的研究资源和结果,促进了NLP社区的进一步研究和合作,并鼓励将LLaMA和Alpaca模型改编为其他语言。 Part2 CHINESE LLAMA 针对于中文而言,LLaMA存在的问题: LLaMA标记器的原始词汇中只有不到一千个中文字符。 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览