青稞AI - 公众号 - 文章列表 - 历史文章

注册登录

专栏 RSS订阅（公众号）

温馨提示：订阅专栏后它将会自动更新，无人订阅的专栏有可能不会更新。

我也要提交微信公众号

专栏二维码

TodayRss-海外稳定RSS

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

X平台RSS订阅方法

RSSHub订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词RSS订阅方法

知网期刊RSS订阅方法

即刻RSS订阅方法

他们也喜欢这个专栏

•

今天看啥 › 专栏 › 青稞AI

青年AI研究员idea加油站，AI开发者的新能源充电桩。

免责声明：本专栏仅为信息导航参考，不代表原文立场或观点。原专栏内容版权归原作者所有，如您为原作者并希望删除该专栏，请通过【版权申诉通道】联系我们处理。

最新

开通 RSS极速订阅可分钟级获得文章

从 RL for LLM 视角重新理解 KL 估计

青稞AI · 公众号 · AI · 1 周前 ·

北京到底谁在做RL&Infra！8月24日线下LLM RL & RL Infra Meetup开启报...

青稞AI · 公众号 · AI · 1 周前 ·

GRPO的进化之路：从 GRPO 走向 DAPO 和 GSPO

青稞AI · 公众号 · AI · 2 周前 ·

ICCV 2025 Highlight Paper！ETCH: 通过等变紧度向量将人体拟合推广到穿衣...

青稞AI · 公众号 · AI · 2 周前 ·

实录精选｜通义千问研究员郑楚杰博士：GSPO算法解析与问答

青稞AI · 公众号 · AI · 2 周前 ·

梳理SGLang中DP Attention及其Padding问题

青稞AI · 公众号 · AI · 2 周前 ·

探讨一下RL算法特性导致的资源闲置问题以及一些可能的解法

青稞AI · 公众号 · AI · 2 周前 ·

浅聊RL框架的勃勃生机、万物竞发

青稞AI · 公众号 · AI · 2 周前 ·

Qwen-Image技术报告：数据工程+超多阶段训练

青稞AI · 公众号 · AI · 2 周前 ·

强化学习的10层境界（下）：多智能体与博弈，以及LLM引导的策略生成

青稞AI · 公众号 · AI · 2 周前 ·

如何推广 RLVR 到通用领域推理问题？一起来聊聊基于参考概率奖励的强化学习 RLPR

青稞AI · 公众号 · AI · 2 周前 ·

阶跃星辰朱亦博｜Step-3推理系统：从PD分离到AF分离（AFD）

青稞AI · 公众号 · AI · 2 周前 ·

探讨Reasoning LLM中的内在奖励

青稞AI · 公众号 · AI · 3 周前 ·

ACL 2025 Oral｜Evaluation Agent：面向视觉生成模型的高效可提示的评估框架

青稞AI · 公众号 · AI · 3 周前 ·

聊聊SeaAI Lab的PP优化工作 PipeOffload

青稞AI · 公众号 · AI · 3 周前 ·

实录精选｜slime开源项目作者朱子霖：Infra视角下，为 RL Scaling设计的训练框架

青稞AI · 公众号 · AI · 3 周前 ·

一文读懂流水线并行训练升级之路！From Naive to V-shape Zero Bubble

青稞AI · 公众号 · AI · 3 周前 ·

周四晚8点，和通义千问郑楚杰博士，一起聊聊Qwen3背后的大规模强化学习训练算法GSPO

青稞AI · 公众号 · AI · 3 周前 ·

OpenAI开源小模型gpt-oss的妙妙小观察

青稞AI · 公众号 · AI · 3 周前 ·

深度好文！强化学习的10层境界：从巴甫洛夫的狗到贝叶斯大脑（中）

青稞AI · 公众号 · AI · 3 周前 ·

关于移动版 · TodayRss海外 · RSS之家 · 卧龙AI搜索 · 更多产品 ·

今天看啥 - 公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

© 2025 ~ 沪ICP备11025650号