专栏名称: CVer
一个专注侃侃计算机视觉方向的公众号。计算机视觉、图像处理、机器学习、深度学习、C/C++、Python、诗和远方等。
今天看啥  ›  专栏  ›  CVer

ICML 2025 | 英伟达提出SANA 1.5:线性扩散Transformer刷新文生图SOTA!

CVer  · 公众号  ·  · 2025-05-02 23:59
    

文章预览

点击下方 卡片 ,关注“ CVer ”公众号 AI/CV重磅干货,第一时间送达 发论文必看!五一福利!快领取CV er学术知识星球优惠券: 50元新用户优惠券(左图领取) , 7折+20元老用户续费券 (右图领取) ,大家抓紧扫码加入学习!每天分享最新最优质的AI工作,最强助力你的科研和工作!ideas拉满! 转载自:新智元 |编辑:英智 好困 【导读】 SANA 1.5是一种高效可扩展的线性扩散Transformer,针对文本生成图像任务进行了三项创新:高效的模型增长策略、深度剪枝和推理时扩展策略。这些创新不仅大幅降低了训练和推理成本,还在生成质量上达到了最先进的水平。 近年来,文本生成图像的技术不断突破,但随着模型规模的扩大,计算成本也随之急剧上升。 为此, 英伟达联合 MIT、清华、北大等机构的研究人员 提出了 一种 高效可扩展的线性扩散 Transformer—— SA ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览