注册登录

看啥推荐读物

专栏名称: CVer

一个专注侃侃计算机视觉方向的公众号。计算机视觉、图像处理、机器学习、深度学习、C/C++、Python、诗和远方等。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

知乎回答RSS订阅方法

知乎专栏 RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

艾邦高分子 · 中科兴业PPS产品顺利装机智能机器人· 15 小时前

高分子科技 · 天津科技大学赵倩-李盛华课题组 Adv. ...· 2 天前

高分子科技 · 华南理工大学郭建华教授团队 ...· 2 天前

艾邦高分子 · 2024年，聚烯烃弹性体POE国产化元年！· 3 天前

化学加 · 上海交通大学李学刚团队新技术应用：全球首套D ...· 5 天前

今天看啥 › 专栏 › CVer

ICLR 2023 | 厦大&港大提出MRM：利用视觉+语言数据增强视觉特征

CVer · 公众号 · · 2023-02-12 23:59

点击下方卡片，关注“CVer”公众号AI/CV重磅干货，第一时间送达点击进入—>CV微信技术交流群Advancing Radiograph Representation Learning with Masked Record Modeling代码: https://github.com/RL4M/MRM-pytorch论文: https://arxiv.org/abs/2301.13155研究动机传统的多模态预训练方法通常需要"大数据"+"大模型"的组合来同时学习视觉+语言的联合特征。但是关注如何利用视觉+语言数据提升视觉任务（多模态->单模态）上性能的工作并不多。本文旨在针对上述问题提出一种简单高效的方法。在这篇文章中，以医疗影像上的特征学习为例，我们提出对图像+文本同时进行掩码建模（即Masked Record Modeling，Record={Image,Text}）可以更好地学习视觉特征。该方法具有以下优点：简单。仅通过特征相加就可以实现多模态信息的融合。此处亦可进一步挖掘，比如引入更高效的融合策略或者扩展到其它领域。 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照

分享到微博

推荐文章

艾邦高分子 · 中科兴业PPS产品顺利装机智能机器人

15 小时前

高分子科技 · 天津科技大学赵倩-李盛华课题组 Adv. Energy Mater.：基于天然产物配位聚合物的高效电解水析氧催化剂

2 天前

高分子科技 · 华南理工大学郭建华教授团队 Small：具有多层梯度结构的复合气凝胶用于宽频微波吸收和动态红外伪装

2 天前

艾邦高分子 · 2024年，聚烯烃弹性体POE国产化元年！

3 天前

化学加 · 上海交通大学李学刚团队新技术应用：全球首套DCS制甲硅烷工业装置建成投产

5 天前

细胞基因研究圈 · 净利暴跌85%！mRNA巨头Moderna艰难转型之年

2 月前

占豪 · 赞比亚总统：美国拿什么和中国比！

1 年前

小花生网 · 开团 | 用这款“写作批改神器”, 增强语法能力, 提高写作效率...

2 年前

腾讯道学 · 年中天子太岁神掌管运程判祸福(上)

5 年前

期货圈 · IPO前夕敲诈1200万，判刑9年

6 年前

关于移动版 · Py中国 · RSS之家 · codingpro · Code · link之家 · 卧龙AI搜索 · 藏经阁 · 小百科

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号