|
免费 | 中国人民大学公开7.5小时大模型导论视频课程(含10次直播答疑) oldpan博客 · 公众号 · · 1 月前 · 访问文章快照 |
|
和满血R1性能一样的推理QWQ-32B开源,部署成本拉低一大截 oldpan博客 · 公众号 · · 1 月前 · 访问文章快照 |
|
[vLLM vs TensorRT-LLM] #6. Weight-Only Quantization 仅权重量化的性能比较 oldpan博客 · 公众号 · · 2 月前 · 访问文章快照 |
|
完整的671B MoE DeepSeek R1如何本地化部署? oldpan博客 · 公众号 · · 2 月前 · 访问文章快照 |
|
书生·浦语大模型升级,突破思维密度,4T数据训出高性能模型 oldpan博客 · 公众号 · · 3 月前 · 访问文章快照 |
|
从算法转到模型推理的应届生拿到6个offer:思考与经验 oldpan博客 · 公众号 · · 3 月前 · 访问文章快照 |
|
使用float8和FSDP2实现超级训练性能 oldpan博客 · 公众号 · · 5 月前 · 访问文章快照 |
|
大模型时代进入应用落地阶段,推理与部署岗的春天来了 oldpan博客 · 公众号 · · 5 月前 · 访问文章快照 |
|
腾讯语音合成技术:模型优化与推理加速实践 oldpan博客 · 公众号 · · 5 月前 · 访问文章快照 |
|
回顾PyTorch Eager Mode 量化 TensorRT 加速 oldpan博客 · 公众号 · · 5 月前 · 访问文章快照 |
|
vLLM这一年的新特性以及后续规划(总结版!) oldpan博客 · 公众号 · · 5 月前 · 访问文章快照 |