专栏 RSS订阅(公众号)
温馨提示:订阅专栏后它将会自动更新,无人订阅的专栏有可能不会更新。
专栏 二维码
TodayRss-海外稳定RSS
他们也喜欢这个专栏
 • 
RSS订阅
今天看啥  ›  专栏  ›  青稞AI
青年AI研究员idea加油站,AI开发者的新能源充电桩。
免责声明:本专栏仅为信息导航参考,不代表原文立场或观点。 原专栏内容版权归原作者所有,如您为原作者并希望删除该专栏,请通过 【版权申诉通道】联系我们处理。
开通 RSS极速订阅 可分钟级获得文章
从 RL for LLM 视角重新理解 KL 估计
青稞AI  ·  公众号  · AI  ·  1 周前  · 
北京到底谁在做RL&Infra!8月24日线下LLM RL & RL Infra Meetup开启报...
青稞AI  ·  公众号  · AI  ·  1 周前  · 
GRPO的进化之路:从 GRPO 走向 DAPO 和 GSPO
青稞AI  ·  公众号  · AI  ·  2 周前  · 
ICCV 2025 Highlight Paper!ETCH: 通过等变紧度向量将人体拟合推广到穿衣...
青稞AI  ·  公众号  · AI  ·  2 周前  · 
梳理SGLang中DP Attention及其Padding问题
青稞AI  ·  公众号  · AI  ·  2 周前  · 
探讨一下RL算法特性导致的资源闲置问题以及一些可能的解法
青稞AI  ·  公众号  · AI  ·  2 周前  · 
浅聊RL框架的勃勃生机、万物竞发
青稞AI  ·  公众号  · AI  ·  2 周前  · 
Qwen-Image技术报告:数据工程+超多阶段训练
青稞AI  ·  公众号  · AI  ·  2 周前  · 
阶跃星辰朱亦博|Step-3推理系统:从PD分离到AF分离(AFD)
青稞AI  ·  公众号  · AI  ·  2 周前  · 
探讨Reasoning LLM中的内在奖励
青稞AI  ·  公众号  · AI  ·  3 周前  · 
ACL 2025 Oral|Evaluation Agent:面向视觉生成模型的高效可提示的评估框架
青稞AI  ·  公众号  · AI  ·  3 周前  · 
聊聊SeaAI Lab的PP优化工作 PipeOffload
青稞AI  ·  公众号  · AI  ·  3 周前  · 
一文读懂流水线并行训练升级之路!From Naive to V-shape Zero Bubble
青稞AI  ·  公众号  · AI  ·  3 周前  · 
周四晚8点,和通义千问郑楚杰博士,一起聊聊Qwen3背后的大规模强化学习训练算法GSPO
青稞AI  ·  公众号  · AI  ·  3 周前  · 
OpenAI开源小模型gpt-oss的妙妙小观察
青稞AI  ·  公众号  · AI  ·  3 周前  · 
深度好文!强化学习的10层境界:从巴甫洛夫的狗到贝叶斯大脑(中)
青稞AI  ·  公众号  · AI  ·  3 周前  ·