|
|
Jeff Dean:智能体时代,定义问题比写代码更重要 NeuralTalk · 公众号 · · 10 小时前 · |
|
|
基于 Roofline 建模的端侧大语言模型硬件协同设计缩放律 NeuralTalk · 公众号 · · 18 小时前 · |
|
|
Karpathy的AutoResearch开源项目:100次实验/夜,5分钟/轮,AI 智能体自动化... NeuralTalk · 公众号 · · 3 天前 · |
|
|
RL 驱动的 KV 缓存压缩框架 KV Policy: 超越启发式策略 SOTA 性能,仅增 1% ... NeuralTalk · 公众号 · · 1 周前 · |
|
|
超越仿真,精准预测推理性能!上交与阿里提出SynPerf:一种混合分析与机器学习的 GPU 性能预测... NeuralTalk · 公众号 · · 2 周前 · |
|
|
最高 4.7 倍加速!UCSD、Meta 提出 AutoOverlap:以块级细粒度重叠融合计算与通... NeuralTalk · 公众号 · · 2 周前 · |
|
|
5.6 倍有效吞吐提升!FlowPrefill 细粒度抢占缓解队头阻塞,满足严格 3.1 倍的 SL... NeuralTalk · 公众号 · · 2 周前 · |