注册登录

专栏名称: 机器学习算法与自然语言处理

一个有情怀的公众号。机器学习、自然语言处理、算法等知识集中营、期待与你相遇~

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词RSS订阅方法

知网期刊RSS订阅方法

即刻RSS订阅方法

目录

相关文章推荐

电脑吧评测室 · 【硬件资讯】还有更多！Intel与AMD下一 ... · 9 小时前

电脑吧评测室 · 6·18轻薄性能本推荐合集！多款国补最低还不 ... · 9 小时前

电脑吧评测室 · OMEN 暗影精灵 11上手体验，真一线产品标杆 · 18 小时前

电脑吧评测室 · OMEN 暗影精灵 11上手体验，真一线产品标杆 · 18 小时前

电脑吧评测室 · OMEN 暗影精灵 11上手体验，真一线产品标杆 · 18 小时前

电脑吧评测室 · 存储遇见AI，江波龙在COMPUTEX ... · 2 天前

电脑吧评测室 · 【装机帮扶站】第1235期：4000元价位装 ... · 2 天前

今天看啥 › 专栏 › 机器学习算法与自然语言处理

大模型的基本功

机器学习算法与自然语言处理 · 公众号 · · 2024-08-31 00:00

文章预览

MLNLP 社区是国内外知名的机器学习与自然语言处理社区，受众覆盖国内外NLP硕博生、高校老师以及企业研究人员。社区的愿景是促进国内外自然语言处理，机器学习学术界、产业界和广大爱好者之间的交流和进步，特别是初学者同学们的进步。转载自 | 知乎作者 | ybq 这篇文章给大家推荐几个大模型的练手程序，也就是所谓的“基本功”。先问个问题，除了 transformer、rope、swiglu、rms_norm，大家觉着大模型的基本功都有哪些呢？flash_attention 的原理？megatron 的各种 parallel 策略？量化和推理加速技术？cuda编程？怎么说呢，这些“有技术含量的大模型的核心技术”确实很重要，但我个人还是觉着大多数人在实际工作中并不需要完全理解它们。因为它们追求的是模型性能的极限优化，对我们做个简单的 SFT、PPO 并无太大助力。往往我们的需求只是使用它 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

电脑吧评测室 · 【硬件资讯】还有更多！Intel与AMD下一代显卡架构现身代码库，已开始开发工作，下一代能否挑战NVIDIA？？

9 小时前

电脑吧评测室 · 6·18轻薄性能本推荐合集！多款国补最低还不到3000元！

9 小时前

电脑吧评测室 · OMEN 暗影精灵 11上手体验，真一线产品标杆

18 小时前

电脑吧评测室 · OMEN 暗影精灵 11上手体验，真一线产品标杆

18 小时前

电脑吧评测室 · OMEN 暗影精灵 11上手体验，真一线产品标杆

18 小时前

电脑吧评测室 · 存储遇见AI，江波龙在COMPUTEX 2025的综合创新之旅

2 天前

电脑吧评测室 · 【装机帮扶站】第1235期：4000元价位装机新宠！RTX5060显卡配置推荐

2 天前

AIWalker · 终于不用为GPU算力发愁了，请低调实用！

11 月前

中交一航 · 为钢厂解决用水难题

11 月前

TGB湖南人 · 【9.12复盘】高位股终于止跌，反核冠军带着他奇怪的题材涨停潮。。。

8 月前

东莞本地宝 · 重要提醒！东莞水濂山碧玉湖公园将举行森林火灾演练！

5 月前

APPSO · AI 独角兽阶跃星辰完成数亿美元融资，国产 AI 六小龙迈入决赛圈

5 月前

关于移动版 · Py中国 · RSS之家 · CodingPro · Code · Link之家 · 卧龙AI搜索 · 小百科 · 小百科（海外） · Link管理

今天看啥 - 公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

© 2025 ~ 沪ICP备11025650号