|
|
Agent下半场来啦!行动驱动和自我进化的智能体推理 | 直播预约 深度学习自然语言处理 · 公众号 · · 2 天前 · |
|
|
多智能体大语言模型中的人类自适应协作 深度学习自然语言处理 · 公众号 · · 5 天前 · |
|
|
微软 & UT Dallas 联手揭秘:从 SFT 到 RL 的进阶之路 深度学习自然语言处理 · 公众号 · · 5 天前 · |
|
|
无需微调:模型如何主动利用上下文实现持续学习 | NICE138期 深度学习自然语言处理 · 公众号 · · 1 周前 · |
|
|
DroPE:不进行长上下文微调实现无缝的零样本上下文扩展 | 直播预约 深度学习自然语言处理 · 公众号 · · 1 周前 · |
|
|
TDScaling:从数量 Scaling转向多样性 Scaling,重塑 Code Agent 训... 深度学习自然语言处理 · 公众号 · · 1 周前 · |
|
|
World Model 能让 Agent “预知未来”吗?这篇新范式研究给出了一个有点反直觉的答案 深度学习自然语言处理 · 公众号 · · 1 周前 · |