看啥推荐读物
专栏名称: oldpan博客
老潘的博客,程序员眸中的fantasy life,分享AI技术干货,让大家少走弯路~
今天看啥  ›  专栏  ›  oldpan博客

快速提升性能,如何更好地使用GPU(下)

oldpan博客  · 公众号  ·  · 2024-05-14 08:28
 接着上一篇的话题,快速提升性能,如何更好地使用GPU(上)。上篇聊到了如何充分利用GPU的计算资源(SM),这里我们再从另一个角度看下如何提升性能。个人水平有限,如文章有误,欢迎评论区讨论.之前也提到,我们可以将所有要做的任务都一股脑扔给GPU,换句话说,就是可以将要计算的算法提前交到异步工作队列中(为什么是提前,就是这个任务发射出去了,kernel launch了,但实际还没有执行),这个队列一般叫做stream,如果没有设置的话,任务会处在default stream中。imageGPU可以有很多stream,分任务不同使用的stream数量也不同。我们在平常使用的时候可以充分利用stream的特性:A stream is a queue of device workKernel launches and Async CUDA API calls place work in the queue and continueDevices schedule work from streams to available resourcesOperations within a stream are ordered (FIFO) and cann ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照