总结版 | vLLM这一年的新特性以及后续规划

自动驾驶之心 · 公众号 · · 2024-11-10 00:00

文章预览

作者 | oldpan 编辑 | 自动驾驶之心点击下方卡片，关注“ 自动驾驶之心 ”公众号戳我-> 领取自动驾驶近15个方向学习路线 >> 点击进入→ 自动驾驶之心『视觉大语言模型』技术交流群本文只做学术分享，如有侵权，联系删文本文来自 The State of vLLM | Ray Summit 2024 & & RoadMap的分享，带大家一起回顾下vllm发展历史、过去一年的发展及接下来Q4规划。感兴趣的也可以查看原视频： https://www.youtube.com/watch?v=4HPRf9nDZ6Q [1] 过去一年vLLM的工作内容记得vLLM在九月初更新了一个版本 [2] ，性能有了明显的提升（支持了 multi step ，因为减少了CPU overhead，会对吞吐会有提升，但是带来的副作用是TTFT和ITL会变大），某些场景确实带来了收益。 vLLM在2024年更新了很多内容～首先是模型支持，支持几乎所有的llm和vlm模型且效率非常高，这点确实要比TRT-LLM支持 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

新闻广角 · 消息人士：马云回归是绝不可能的，并且马云是创始人也从来没离开过

13 小时前

新闻广角 · 巴基斯坦称出动“枭龙”战机摧毁印度S-400防空系统，印方回应

15 小时前

新闻广角 · 42岁孙俪发文告别

昨天

新闻广角 · 工信部出手整顿隐藏式车门把手

昨天

广东省发展和改革委员会 · 珠海市金湾区全力深化农村集体资产管理服务改革促进城乡要素自由流动：广东省城乡融合发展典型案例

4 月前

三台交警 · 一季度我国高质量发展成效明显

4 周前