|
|
Transformer已死?DeepMind正在押注另一条AGI路线 数据派THU · 公众号 · 大数据 · 1 月前 · |
|
|
告别臃肿代码!Python这6个隐藏功能让效率翻倍 数据派THU · 公众号 · 大数据 · 1 月前 · |
|
|
AgentCPM-Explore开源,4B 参数突破端侧智能体模型性能壁垒 数据派THU · 公众号 · 大数据 · 1 月前 · |
|
|
CVPR MobileMamba:精度速度双杀MobileNet 数据派THU · 公众号 · 大数据 · 1 月前 · |
|
|
DeepSeek 突发梁文锋署名新论文:V4 新架构提前曝光? 数据派THU · 公众号 · 大数据 · 1 月前 · |
|
|
马不停蹄 一路生花 | 数据派THU优秀志愿者风采展 数据派THU · 公众号 · 大数据 · 1 月前 · |
|
|
让两个大模型「在线吵架」,他们跑通了全网95%科研代码|深势发布Deploy-Master 数据派THU · 公众号 · 大数据 · 1 月前 · |
|
|
清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开 数据派THU · 公众号 · 大数据 · 1 月前 · |
|
|
告别长文微调!PoPE 破解 RoPE 耦合难题,零样本外推超 RoPE/YaRN 数据派THU · 公众号 · 大数据 · 1 月前 · |
|
|
2025年最系统的AI Agents时代Memory综述~ 数据派THU · 公众号 · 大数据 · 1 月前 · |
|
|
数据派志愿者招募 | 寻找最志同道合的你! 数据派THU · 公众号 · 大数据 · 2 月前 · |
|
|
分析近六十种科学模型,MIT:基础模型或学得物理现实的共同底层表征,附实验证据 数据派THU · 公众号 · 大数据 · 2 月前 · |
|
|
从优化到推理:Transformer 贝叶斯本质的几何 + 动力学全景解析 数据派THU · 公众号 · 大数据 · 2 月前 · |
|
|
LLM内部竟藏着众多策略模型?自所&腾讯团队首次揭示大模型RL新机制 数据派THU · 公众号 · 大数据 · 2 月前 · |
|
|
为什么大家都用RAG,这篇小白都看懂了 数据派THU · 公众号 · 大数据 · 2 月前 · |
|
|
非程序员爆肝 30 亿 Token!AI+CLI 解锁编程新范式,4 个月搞定 N 个项目 数据派THU · 公众号 · 大数据 · 2 月前 · |
|
|
Pythonic 核心!上下文管理器的设计哲学与自定义实战指南(附代码) 数据派THU · 公众号 · 大数据 · 2 月前 · |
|
|
Claude Code 一小时「复刻」谷歌一年成果,那一年能读完五年半的博士吗? 数据派THU · 公众号 · 大数据 · 2 月前 · |
|
|
别再把KL散度加进loss了!Bengio团队实证:回归Reward才是无偏正解 数据派THU · 公众号 · 大数据 · 2 月前 · |
|
|
超越AlphaFold3,实现模型容量的规模化扩展,字节提出分子结构预测模型SeedFold 数据派THU · 公众号 · 大数据 · 2 月前 · |