|
梳理RWKV 4,5(Eagle),6(Finch)架构的区别以及个人理解和建议 GiantPandaCV · 公众号 · 3D · 3 天前 · 访问文章快照 |
|
100+论文与创新点!SLAM+路径规划资料合集 GiantPandaCV · 公众号 · 3D · 4 天前 · 访问文章快照 |
|
如何用Infini-attention实现超长上下文Transformer GiantPandaCV · 公众号 · 3D · 5 天前 · 访问文章快照 |
|
Tensor Cores 使用介绍 GiantPandaCV · 公众号 · 3D · 1 周前 · 访问文章快照 |
|
推理部署工程师面试题库 GiantPandaCV · 公众号 · 3D · 1 周前 · 访问文章快照 |
|
CVPR2024-扩散模型可解释性新探索,图像生成一致性创新高!AI视频生成新机遇? GiantPandaCV · 公众号 · 3D · 1 周前 · 访问文章快照 |
|
最新大模型论文研究论文合集,包含谷歌/苹果/亚马逊/港大、阿里最新研究报告! GiantPandaCV · 公众号 · 3D · 1 周前 · 访问文章快照 |
|
系统调优助手,PyTorch Profiler TensorBoard 插件教程 GiantPandaCV · 公众号 · 3D · 1 周前 · 访问文章快照 |
|
CUTLASS 基础介绍 GiantPandaCV · 公众号 · 3D · 1 周前 · 访问文章快照 |
|
图解大模型计算加速系列:vLLM源码解析2,调度器策略(Scheduler) GiantPandaCV · 公众号 · 3D · 1 周前 · 访问文章快照 |
|
nndeploy - 一款开源的模型端到端部署框架 GiantPandaCV · 公众号 · 3D · 2 周前 · 访问文章快照 |
|
TensorRT-LLM初探(二)简析了结构,用的更明白 GiantPandaCV · 公众号 · 3D · 2 周前 · 访问文章快照 |
|
最新11个SAM+医学图像创新点,冲Nature! GiantPandaCV · 公众号 · 3D · 2 周前 · 访问文章快照 |
|
ICLR 2024 spotlight WURSTCHEN - 一个高效的大规模文本到图像扩散模型的架构 GiantPandaCV · 公众号 · 3D · 2 周前 · 访问文章快照 |
|
图解大模型计算加速系列:vLLM源码解析1,整体架构 GiantPandaCV · 公众号 · 3D · 2 周前 · 访问文章快照 |
|
LLM推理加速的文艺复兴:Noam Shazeer和Blockwise Parallel Decoding GiantPandaCV · 公众号 · 3D · 2 周前 · 访问文章快照 |
|
大模型训练加速之FlashAttention系列:爆款工作背后的产品观 GiantPandaCV · 公众号 · 3D · 3 周前 · 访问文章快照 |
|
大模型推理核心技术之Continuous Batching和我的WXG往事 GiantPandaCV · 公众号 · 3D · 3 周前 · 访问文章快照 |
|
如何为LLM推理任务选择正确的GPU GiantPandaCV · 公众号 · 3D · 3 周前 · 访问文章快照 |
|
《PytorchConference2023翻译系列》25 数据加载技术的演进 GiantPandaCV · 公众号 · 3D · 3 周前 · 访问文章快照 |