|
|
一个月烧掉5亿美元账单之后:这项研究在问,Agent到底知不知道自己花了多少? 大模型智能 · 公众号 · 大模型 · 11 小时前 · |
|
|
解决大模型训练LossSpike!重新设计激活函数SwiGLU,聊聊蚂蚁Ling模型背后的PowLU 大模型智能 · 公众号 · 大模型 · 昨天 · |
|
|
张亦弛@清华大学-从思考到行动:智能体时代的可信AI 大模型智能 · 公众号 · 大模型 · 2 天前 · |
|
|
MiniMax新旗舰M3发布!自己干了12小时复现获奖论文,三条科技树同时点满 大模型智能 · 公众号 · 大模型 · 3 天前 · |
|
|
DDIM之父宋佳铭,宣布离职 大模型智能 · 公众号 · 大模型 · 4 天前 · |
|
|
· 公众号 · 大模型 · 5 天前 · |
|
|
DiffusionOPD:复旦联合通义万相提出扩散模型「在线策略蒸馏」新范式,让学⽣模型同时学会构图... 大模型智能 · 公众号 · 大模型 · 6 天前 · |
|
|
关于Agent Harness,我整理了一个最小版! 大模型智能 · 公众号 · 大模型 · 1 周前 · |
|
|
DeepSeek陈德里开发自动研究Skill,写一篇论文人类只动脑2小时 大模型智能 · 公众号 · 大模型 · 1 周前 · |
|
|
程子豪@北京航空航天大学:Terminal-World:面向终端智能体的大规模环境合成 大模型智能 · 公众号 · 大模型 · 1 周前 · |
|
|
ICLR2026|Next-ToBE:让"自信而短视"的大模型看得更远、推理更准 大模型智能 · 公众号 · 大模型 · 1 周前 · |
|
|
从KL的方向看SFT与RL:大模型到底是在”学会做”,还是在”学会选”? 大模型智能 · 公众号 · 大模型 · 1 周前 · |
|
|
谷歌CEO承认Coding落后了 大模型智能 · 公众号 · 大模型 · 1 周前 · |
|
|
OpenAI大神教你如何榨干Codex 大模型智能 · 公众号 · 大模型 · 1 周前 · |
|
|
李飞飞再出手,空间智能的ImageNet来了 大模型智能 · 公众号 · 大模型 · 1 周前 · |
|
|
OPD到底在优化什么?三类典型失败以及修复路径 大模型智能 · 公众号 · 大模型 · 2 周前 · |
|
|
Gemini3.5来了!今夜,谷歌亲手淘汰谷歌 大模型智能 · 公众号 · 大模型 · 2 周前 · |
|
|
让大模型学会「自己教自己」!京东 & 中科院信工所连发三篇论文定义Self-TaughtRLVR 大模型智能 · 公众号 · 大模型 · 2 周前 · |
|
|
对比离线蒸馏!为什么选择OPD? 大模型智能 · 公众号 · 大模型 · 2 周前 · |
|
|
大语言模型为什么能像人一样说话和思考? 大模型智能 · 公众号 · 大模型 · 2 周前 · |