文章预览
作者丨 DefTruth 来源丨 https://zhuanlan.zhihu.com/p/1902778199261291694 编辑丨GiantPandaLLM 0x00 前言 后续会陆续更新一些CUDA和Triton Kernel 编程入门向的文章,虽然比较浅显简单,但我自己挺喜欢这种温故而知新的感觉。 本人更多的技术笔记以及CUDA学习笔记,欢迎来LeetCUDA ( https://github.com/xlite-dev/LeetCUDA) 查阅。LeetCUDA包括了本人的 LLM/VLM 文章整理,以及对 FlashAttention、SGEMM、HGEMM、GEMV 等常见 CUDA Kernel 的 示例实现 ,目前已经累计 3k+ stars ,传送门 : xlite-dev/LeetCUDA ( https://github.com/xlite-dev/LeetCUDA) LeetCUDA: Modern CUDA Learn Notes with PyTorch for Beginners 本人Triton相关笔记列表如下: DefTruth:[Triton编程][基础] Triton极简入门: Triton Vector Add( https://zhuanlan.zhihu.com/p/1902778199261291694) DefTruth:[Triton编程][基础] Triton Fused Softmax Kernel详解: 从Python到PTX( https://zhuanlan.zhihu.com/p/1899562146477609112) DefT
………………………………