|
|
ICML'26 | 阿里最新推出 RT-Lynx:把稀疏性用在“对的地方”,让DiT跑的快且不掉点! 青稞AI · 公众号 · AI · 8 小时前 · |
|
|
自动化所最新推出 π-Play: 基于自博弈生成特权信息的自蒸馏大模型自进化框架 青稞AI · 公众号 · AI · 昨天 · |
|
|
直播预告!大模型后训练,如何实现百万级 LoRA 策略的训练与推理? 青稞AI · 公众号 · AI · 昨天 · |
|
|
一人独作 GQLA!挑战 DeepSeek 的 MLA、DSA 青稞AI · 公众号 · AI · 3 天前 · |
|
|
直播预告|从 MiniLLM 开始,为什么 OPD 正在成为推理模型时代的“基础设施”? 青稞AI · 公众号 · AI · 3 天前 · |
|
|
近 4 倍训练吞吐加速,RLinf 让 DreamZero 训练时长从 1 个月缩短至 1 周! 青稞AI · 公众号 · AI · 4 天前 · |
|
|
实录精选|LeCun说是死路,OpenAI在豪赌:世界模型究竟是机器人的未来,还是算法的陷阱? 青稞AI · 公众号 · AI · 6 天前 · |
|
|
长文本推理一定要改架构?阿里最新提出 RTPurbo:仅需百步训练,无损达到 97%+ 稀疏度与 9... 青稞AI · 公众号 · AI · 1 周前 · |
|
|
直播预告!从长上下文到在线记忆,动态演化原生记忆的一次尝试 青稞AI · 公众号 · AI · 1 周前 · |
|
|
从 KL 的方向看 SFT 与 RL:大模型到底是在”学会做”,还是在”学会选”? 青稞AI · 公众号 · AI · 1 周前 · |
|
|
实录精选!全栈适配 DeepSeek V4,SGLang 如何实现系统级性能突破? 青稞AI · 公众号 · AI · 1 周前 · |
|
|
清华最新论文!动态 MoE 迁移算法 ZEDA:让 MoE 自己学会"摸鱼",推理提速 20% 青稞AI · 公众号 · AI · 1 周前 · |
|
|
ACL 2026|多模态大模型是“看错”还是“想错”?浙大 VL-Calibration 让模型学会... 青稞AI · 公众号 · AI · 1 周前 · |
|
|
ICLR 2026|Next-ToBE:让"自信而短视"的大模型看得更远、推理更准 青稞AI · 公众号 · AI · 1 周前 · |
|
|
ACL 2026 Findings | 浙大提出 GFT:On-Policy SFT 视角下的奖励微... 青稞AI · 公众号 · AI · 1 周前 · |
|
|
直播预告!面向几何与运动理解的流式前馈 3D/4D 重建 青稞AI · 公众号 · AI · 1 周前 · |
|
|
推荐一个精品 AI 创业 + 技术小局:Model / Agent / 出海 青稞AI · 公众号 · AI · 1 周前 · |
|
|
别再刷 HumanEval 了!北大团队 RepoZero 揭示:LLM 从零建库成功率不足 60% 青稞AI · 公众号 · AI · 2 周前 · |
|
|
如何合成 Agentic 事实性 SFT / Mid-train 数据? 青稞AI · 公众号 · AI · 2 周前 · |
|
|
深度!DeepSeek-V4 中的 MegaMoE,细致的 Overlap 通信和计算延迟方案 青稞AI · 公众号 · AI · 2 周前 · |