看啥推荐读物
专栏名称: GiantPandaCV
专注于机器学习、深度学习、计算机视觉、图像处理等多个方向技术分享。团队由一群热爱技术且热衷于分享的小伙伴组成。我们坚持原创,每天一到两篇原创技术分享。希望在传播知识、分享知识的同时能够启发你,大家一起共同进步(・ω<)☆
今天看啥  ›  专栏  ›  GiantPandaCV

图解大模型计算加速系列:vLLM源码解析2,调度器策略(Scheduler)

GiantPandaCV  · 公众号  · 3D  · 2024-04-14 22:24
大家好,vLLM源码解读第二期更新了,本期我们一起来解读vLLM的调度器策略。实话说,这真得是我写过最难的源码解读了。由于vLLM代码本身的复杂性,逻辑上的嵌套性,使得我在读源码时,先接收到的是碎片化的东西,当代码一长、细节一多时,就很难把碎片化的东西拼成全貌。所以在本系列对vLLM的介绍中,不管是哪一块,都会按照“宏观(图解) -> 细节(配合源码)”的方式,先理清vLLM在这里想做什么事,为什么要这么做,然后再一起来看各小块的代码实现。【前置阅读】图解大模型计算加速系列:vLLM原理篇图解大模型计算加速系列:vLLM源码解读1,整体架构【全文目录如下】前期提要与本期导览一、入口函数二、SequenceGroup2.1 原生请求输入 2.2 SequenceGroup的作用2.3 SequenceGroup的结构三、add_request: 预处理请求四、step:调度器策略4.1 调度器结构 4. ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照