|
蚂蚁国产GPU训练大模型细节曝光!Ling模型研发负责人回应:关于我们抠FLOPS的一些点滴 数据派THU · 公众号 · 大数据 · 3 周前 · 访问文章快照 |
|
【斯坦福博士论文】时序平滑性假设下的深度神经网络自适应与正则化方法 数据派THU · 公众号 · 大数据 · 3 周前 · 访问文章快照 |
|
「注意力实际上是对数的」?七年前的Transformer还有新发现,Karpathy点赞 数据派THU · 公众号 · 大数据 · 3 周前 · 访问文章快照 |
|
【CVPR2025】MASH-VLM:通过解耦时空表征缓解视频大语言模型中的动作-场景幻觉问题 数据派THU · 公众号 · 大数据 · 3 周前 · 访问文章快照 |
|
2025年清华大学大数据研究中心 | 招募夏季学期《大数据实践课》合作项目 数据派THU · 公众号 · 大数据 · 3 周前 · 访问文章快照 |
|
无编码器架构潜力或被低估,首个无编码器3D多模态LLM大模型来了 数据派THU · 公众号 · 大数据 · 3 周前 · 访问文章快照 |
|
深入解析图神经网络注意力机制:数学原理与可视化实现 数据派THU · 公众号 · 大数据 · 3 周前 · 访问文章快照 |
|
ICLR'25 | mPLUG-Owl3: 统一长视频与多图的高效多模态长序列大模型 数据派THU · 公众号 · 大数据 · 3 周前 · 访问文章快照 |
|
【斯坦福博士论文】构建类人化具身智能体:从人类行为中学习 数据派THU · 公众号 · 大数据 · 3 周前 · 访问文章快照 |
|
世界模型在机器人任务规划中的全新范式:NUS邵林团队提出通用机器人规划模型FLIP 数据派THU · 公众号 · 大数据 · 3 周前 · 访问文章快照 |