专栏 RSS订阅(公众号)
温馨提示:订阅专栏后它将会自动更新,无人订阅的专栏有可能不会更新。
专栏 二维码
TodayRss-海外RSS稳定源
他们也喜欢这个专栏
 • 
RSS订阅
今天看啥  ›  专栏  ›  NeuralTalk
关注深度学习框架开发、模型压缩、低比特量化、移动端推理加速性能优化、工程化部署
免责声明:本专栏仅为信息导航参考,不代表原文立场或观点。 原专栏内容版权归原作者所有,如您为原作者并希望删除该专栏,请通过 【版权申诉通道】联系我们处理。
开通 RSS极速订阅 可分钟级获得文章
Jeff Dean:智能体时代,定义问题比写代码更重要
NeuralTalk  ·  公众号  ·  ·  10 小时前  · 
告别手工调参:FT-Dojo 与 FT-Agent 开启智能体 LLM 微调的自动驾驶时代
NeuralTalk  ·  公众号  ·  ·  昨天  · 
2.8倍解码加速与SOTA级性能!支持张量并行的多分支低秩注意力方案MLRA:Multi-Head ...
NeuralTalk  ·  公众号  ·  ·  4 天前  · 
FlashAttention-4:面向非对称硬件扩展的算法与内核流水线协同设计
NeuralTalk  ·  公众号  ·  ·  5 天前  · 
Attn-QAT:首个 4-bit 注意力量化感知训练,让 FP4 注意力不再掉精度,RTX 509...
NeuralTalk  ·  公众号  ·  ·  6 天前  · 
基于 FPGA 的稀疏注意力加速器 FAST-Prefill:相比 NVIDIA A5000实现 2...
NeuralTalk  ·  公众号  ·  ·  1 周前  · 
刷爆 KernelBench!字节 Seed 联合清华提出 CUDA Agent:大规模智能体强化学...
NeuralTalk  ·  公众号  ·  ·  1 周前  · 
筛选Agentic Skills成功率提升16.2%,Agentic Skills:超越工具使用的系...
NeuralTalk  ·  公众号  ·  ·  1 周前  · 
首篇 LLM 推理失败综述:揭秘 3 大推理类型中 5 类核心失败的量化特征
NeuralTalk  ·  公众号  ·  ·  1 周前  · 
突破 Agentic LLM 推理的存储 I/O 瓶颈!北大、清华联合 DeepSeek 提出 Du...
NeuralTalk  ·  公众号  ·  ·  1 周前  · 
Agent Skill 框架释放小语言模型潜能,12B 模型技能选择准确率逼近 90%,算力成本降低...
NeuralTalk  ·  公众号  ·  ·  1 周前  · 
hls4ml:面向 FPGA AI 部署的开源模块化编译器,实现微秒级延迟、极致资源效率,支持 Py...
NeuralTalk  ·  公众号  ·  ·  2 周前  · 
CGO'25 杀死阶段顺序问题:基于 MLIR 的等式饱和持久化 e-graph,让等价信息贯穿编译...
NeuralTalk  ·  公众号  ·  ·  2 周前  · 
NVIDIA, UCB提出Kernel Blaster:记忆增强上下文 RL 让 CUDA 内核几何...
NeuralTalk  ·  公众号  ·  ·  2 周前  ·