青稞AI - 公众号 - 文章列表 - 历史文章

注册登录

专栏 RSS订阅（公众号）

温馨提示：订阅专栏后它将会自动更新，无人订阅的专栏有可能不会更新。

我也要提交微信公众号

专栏二维码

TodayRss-海外稳定RSS

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

X平台RSS订阅方法

RSSHub订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词RSS订阅方法

知网期刊RSS订阅方法

即刻RSS订阅方法

他们也喜欢这个专栏

•

今天看啥 › 专栏 › 青稞AI

青年AI研究员idea加油站，AI开发者的新能源充电桩。

免责声明：本专栏仅为信息导航参考，不代表原文立场或观点。原专栏内容版权归原作者所有，如您为原作者并希望删除该专栏，请通过【版权申诉通道】联系我们处理。

最新

开通 RSS极速订阅可分钟级获得文章

将监督微调SFT和强化学习RL两种训练范式结合！中科院&美团等提出SRFT

青稞AI · 公众号 · AI · 1 月前 ·

一起来聊聊：强化学习是否真的能提升大模型的推理能力？

青稞AI · 公众号 · AI · 1 月前 ·

LLM推理中Temperature、top_k、top_p的作用原理以及最佳实践

青稞AI · 公众号 · AI · 1 月前 ·

高熵驱动，负向为王：熵感知强化学习如何重塑大模型推理

青稞AI · 公众号 · AI · 1 月前 ·

李飞飞&谢赛宁空间智能新作！“认知地图+语言推理+RL优化”是逼近人类空间认知能力的有效路径

青稞AI · 公众号 · AI · 1 月前 ·

刘子纬团队开源GUI-Reflection！让端到端多模态GUI智能体进行“自我反思”与“纠错”

青稞AI · 公众号 · AI · 1 月前 ·

聊聊大模型RL中的熵坍缩与缓解策略

青稞AI · 公众号 · AI · 1 月前 ·

让你的奖励模型从偏好数据中生成它的不确定度

青稞AI · 公众号 · AI · 1 月前 ·

LLM中On-Policy与Off-Policy的本质区别是什么？

青稞AI · 公众号 · AI · 1 月前 ·

对RoPE旋转位置编码的不严谨理解与代码实现

青稞AI · 公众号 · AI · 1 月前 ·

北京到底有谁在搞Infra？7月13日线下LLM Infra Meetup开启报名

青稞AI · 公众号 · AI · 1 月前 ·

RL突破通用领域推理瓶颈！清华NLP实验室提出基于参考概率奖励的强化学习RLPR

青稞AI · 公众号 · AI · 1 月前 ·

青稞AI技术交流群更新！与青年AI研究员/开发者一起交流最新AI技术

青稞AI · 公众号 · AI · 1 月前 ·

读懂大模型高效微调：从Soft Prompts到 QLoRA的技术跃迁

青稞AI · 公众号 · AI · 1 月前 ·

MIT开源Satori-SWE：用 Evolutionary Test-Time Scaling 让...

青稞AI · 公众号 · AI · 1 月前 ·

探讨一下！RL 真的是 LLM 性能提升的“银弹”吗？

青稞AI · 公众号 · AI · 1 月前 ·

论 Agent 的“持久战”

青稞AI · 公众号 · AI · 1 月前 ·

Kimi Researcher 背后的一些技术思考

青稞AI · 公众号 · AI · 1 月前 ·

Slime 框架深度解析：面向大规模RL的训推一体化实践

青稞AI · 公众号 · AI · 2 月前 ·

万字长文图解Qwen2.5-VL实现细节

青稞AI · 公众号 · AI · 2 月前 ·

关于移动版 · TodayRss海外 · RSS之家 · 卧龙AI搜索 · 更多产品 ·

今天看啥 - 公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

© 2025 ~ 沪ICP备11025650号