注册登录

专栏名称: oldpan博客

老潘的博客，程序员眸中的fantasy life，分享AI技术干货，让大家少走弯路~

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

知乎回答RSS订阅方法

知乎专栏 RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

中国舞台美术学会 · 资讯丨22部优质剧目，第十届“圆梦中国·春苗 ...· 4 天前

中国舞台美术学会 · 聚焦丨大模型如何“赋能”机器人？机器人又如何 ...· 4 天前

中国舞台美术学会 · 资讯丨英国超三分之一私人演出场地停业；话剧《 ...· 5 天前

中国舞台美术学会 · 斯特法诺·波达（Stefano ...· 4 天前

中国舞台美术学会 · 关注丨第二十届上海市大学生话剧节正式开幕· 6 天前

今天看啥 › 专栏 › oldpan博客

【全网首发】Llama3 微调项目实践与教程（XTuner 版）

oldpan博客 · 公众号 · · 2024-04-23 08:02

Llama 3 近期重磅发布，发布了 8B 和 70B 参数量的模型，XTuner 团队对 Llama 3 微调进行了光速支持！！！同时开源社区中涌现了 Llama3-XTuner-CN 手把手教大家使用 XTuner 微调 Llama 3 模型。XTuner：http://github.com/InternLM/XTuner （文明点击阅读原文可直达）Llama3-XTuner-CN： https://github.com/SmartFlowAI/Llama3-XTuner-CN/Llama 3 概览首先我们来回顾一下 Llama 3 亮点概览～首次出现 8B 模型，且 8B 模型与 70B模型全系列使用 GQA (Group Query Attention)。最大模型达到 400B 规模大小，未来几个月内发布！分词器由 SentencePiece 换为了 Tiktoken，与 GPT4 保持一致。相比于 Llama2 的 32000 词表大小，Llama3 的词表大小来到了惊人的 128256。数据方面上，Llama3 使用了约 15T token 用于模型的训练。开源模型大小为 8B 和 70B 两种，每种规模均有开源基座模型和 instruct 模型。Llama3 8B Instruct 模型在数学与代码能力 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照

分享到微博

推荐文章

中国舞台美术学会 · 资讯丨22部优质剧目，第十届“圆梦中国·春苗行动”北京市优秀少儿题材舞台剧目展演再度扬帆启航

4 天前

中国舞台美术学会 · 聚焦丨大模型如何“赋能”机器人？机器人又如何“训练”大模型？

4 天前

中国舞台美术学会 · 资讯丨英国超三分之一私人演出场地停业；话剧《无人生还》在成都连演6场

5 天前

中国舞台美术学会 · 斯特法诺·波达（Stefano Poda）在维罗纳歌剧院歌剧节上的绝佳奉献！

4 天前

中国舞台美术学会 · 关注丨第二十届上海市大学生话剧节正式开幕

6 天前

广西招聘站 · 2023年广西南宁市江南区面向应届生双选招聘中小学教师广西师范大学专场公告

1 年前

合肥飞墨设计 · 森林海 ▏130㎡的完美日式宅~

1 年前

首席商业评论 · 被“九价焦虑”困住的年轻女性

1 年前

Wind万得 · 消费传导！又一速冻食品龙头提价

2 年前

天下网商 · 海底捞二号人物：屡屡救火，曾被踢出局

4 年前

关于移动版 · Py中国 · RSS之家 · codingpro · Code · link之家 · 卧龙AI搜索 · 藏经阁 · 小百科

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号