|
Llama 3 五一超级课堂丨微调、量化部署、评测全覆盖,手把手带你免费学 GiantPandaCV · 公众号 · 3D · 20 小时前 · 访问文章快照 |
|
FasterTransformer Decoding 源码分析(一)-整体框架介绍 GiantPandaCV · 公众号 · 3D · 昨天 · 访问文章快照 |
|
[原创]好消息,微信公众号官方支持留言了 GiantPandaCV · 公众号 · 3D · 3 天前 · 访问文章快照 |
|
[原创]梳理RWKV 4,5(Eagle),6(Finch)架构的区别以及个人理解和建议 GiantPandaCV · 公众号 · 3D · 4 天前 · 访问文章快照 |
|
100+论文与创新点!SLAM+路径规划资料合集 GiantPandaCV · 公众号 · 3D · 5 天前 · 访问文章快照 |
|
[原创]如何用Infini-attention实现超长上下文Transformer GiantPandaCV · 公众号 · 3D · 6 天前 · 访问文章快照 |
|
Tensor Cores 使用介绍 GiantPandaCV · 公众号 · 3D · 1 周前 · 访问文章快照 |
|
推理部署工程师面试题库 GiantPandaCV · 公众号 · 3D · 1 周前 · 访问文章快照 |
|
[原创]CVPR2024-扩散模型可解释性新探索,图像生成一致性创新高!AI视频生成新机遇? GiantPandaCV · 公众号 · 3D · 1 周前 · 访问文章快照 |
|
最新大模型论文研究论文合集,包含谷歌/苹果/亚马逊/港大、阿里最新研究报告! GiantPandaCV · 公众号 · 3D · 1 周前 · 访问文章快照 |
|
[原创]系统调优助手,PyTorch Profiler TensorBoard 插件教程 GiantPandaCV · 公众号 · 3D · 1 周前 · 访问文章快照 |
|
CUTLASS 基础介绍 GiantPandaCV · 公众号 · 3D · 1 周前 · 访问文章快照 |
|
图解大模型计算加速系列:vLLM源码解析2,调度器策略(Scheduler) GiantPandaCV · 公众号 · 3D · 2 周前 · 访问文章快照 |
|
[原创]nndeploy - 一款开源的模型端到端部署框架 GiantPandaCV · 公众号 · 3D · 2 周前 · 访问文章快照 |
|
TensorRT-LLM初探(二)简析了结构,用的更明白 GiantPandaCV · 公众号 · 3D · 2 周前 · 访问文章快照 |
|
最新11个SAM+医学图像创新点,冲Nature! GiantPandaCV · 公众号 · 3D · 2 周前 · 访问文章快照 |
|
[原创]ICLR 2024 spotlight WURSTCHEN - 一个高效的大规模文本到图像扩散模型的架构 GiantPandaCV · 公众号 · 3D · 2 周前 · 访问文章快照 |
|
图解大模型计算加速系列:vLLM源码解析1,整体架构 GiantPandaCV · 公众号 · 3D · 2 周前 · 访问文章快照 |
|
LLM推理加速的文艺复兴:Noam Shazeer和Blockwise Parallel Decoding GiantPandaCV · 公众号 · 3D · 3 周前 · 访问文章快照 |
|
大模型训练加速之FlashAttention系列:爆款工作背后的产品观 GiantPandaCV · 公众号 · 3D · 3 周前 · 访问文章快照 |