看啥推荐读物
专栏名称: OpenCV学堂
一个致力于计算机视觉OpenCV原创技术传播的公众号!OpenCV计算机视觉与tensorflow深度学习相关算法原创文章分享、函数使用技巧、源码分析与讨论、,计算机视觉前沿技术介绍,技术专家经验分享,人才交流,学习交流。
今天看啥  ›  专栏  ›  OpenCV学堂

这个深度学习库能执行10多种图像文本任务,有20多个数据集,还统一接口|已开源

OpenCV学堂  · 公众号  ·  · 2022-10-01 22:32
点击上方↑↑↑“OpenCV学堂”关注我来源:公众号 量子位 授权支持10余种图像文本任务,囊括20多种数据集,还提供SOTA模型性能和可复现预训练及微调实验配置。没错,这是一个视觉语言深度学习框架就可以拥有的。这个库的庐山真面目是:Salesforce亚洲研究院推出的LAVIS。并且,它还统一了接口,降低开发成本和入门门槛。最重要的是:已开源!LAVIS全⽅位⽀持视觉语⾔任务、数据集、模型。如果还不能看不出它的优势,那话不多说,直接看LAVIS与现有多模态库的对比图。相较之下,现存的视觉语⾔框架只⽀持较少⼀部分任务和数据集,逊色了不少。除此之外,LAVIS还附带了丰富的开源资源和⼯具,就比如说它提供了一个图形化的工具,可以可视化数据集的样本,以便于能更好的预览、理解数据。并且随着LAVIS一起开源的还有GUI demo,它的功能就有 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照