专栏 RSS订阅(公众号)
温馨提示:订阅专栏后它将会自动更新,无人订阅的专栏有可能不会更新。
专栏 二维码
TodayRss-海外稳定RSS
他们也喜欢这个专栏
 • 
RSS订阅
今天看啥  ›  专栏  ›  NeuralTalk
关注深度学习框架开发、模型压缩、低比特量化、移动端推理加速性能优化、工程化部署
免责声明:本专栏仅为信息导航参考,不代表原文立场或观点。 原专栏内容版权归原作者所有,如您为原作者并希望删除该专栏,请通过 【版权申诉通道】联系我们处理。
开通 RSS极速订阅 可分钟级获得文章
Act: 首个从张量加速器 ISA 描述自动生成编译器后端工具,实现 1.77 倍性能超越手工优化库...
NeuralTalk  ·  公众号  ·  ·  2 天前  · 
vLLM TPU:一款支持在 TPU 上运行 PyTorch 与 JAX 的全新统一后端
NeuralTalk  ·  公众号  ·  ·  3 天前  · 
Vortex:仅 5 条指令扩展的 RISC-V SIMT GPGPU 开源全栈实现
NeuralTalk  ·  公众号  ·  ·  4 天前  · 
RK3566 GPU内存省11.2%,能耗降42.3%!软硬件协同框架 NanoMind:分解多模态...
NeuralTalk  ·  公众号  ·  ·  6 天前  · 
Tawa:面向现代 GPU 的自动 warp 特化创新方案,性能超cuBLAS 1.1 倍、Trit...
NeuralTalk  ·  公众号  ·  ·  1 周前  · 
Google Coral NPU:面向边缘 AI 的 RISC-V 全栈开源平台
NeuralTalk  ·  公众号  ·  ·  1 周前  · 
MLC-LLM 背后自顶向下的 LLM 测试和调试方法 TapML:让大模型高效部署在浏览器、手机等...
NeuralTalk  ·  公众号  ·  ·  1 周前  · 
苹果 M5 芯片发布,AI 性能狂飙 4 倍!GPU 架构重构 + 16 核神经引擎 + 10 核 ...
NeuralTalk  ·  公众号  ·  ·  1 周前  · 
RISC-V HPC新标杆Sophon SG2044深度评估:支持RVV v1.0适配GCC 15....
NeuralTalk  ·  公众号  ·  ·  2 周前  · 
为 1B/3B LLM 实现近全精度与 3 倍推理加速方案 Tequila:突破死区陷阱的无陷阱三元...
NeuralTalk  ·  公众号  ·  ·  2 周前  · 
打破 NVIDIA 封闭壁垒!这篇 16 年前的论文,如何用 PTX 仿真库解锁 GPU 通用计算?
NeuralTalk  ·  公众号  ·  ·  2 周前  · 
逆向软硬件实现中的浮点累加顺序工具 FPRev
NeuralTalk  ·  公众号  ·  ·  3 周前  · 
PD 多路复用:SGLang 借助 NVIDIA GreenContext 释放高有效吞吐量的大语言...
NeuralTalk  ·  公众号  ·  ·  3 周前  ·