注册登录

专栏名称: 机器之心

专业的人工智能媒体和产业服务平台

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

知乎回答RSS订阅方法

知乎专栏 RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

机器之心 · 辅导作业这么费劲的事，还是交给这个大模型吧· 昨天

爱可可-爱生活 · 百万级GPU数据中心的大规模发展时代即将到来 ...· 2 天前

黄建同学 · Transformer背后机制，30秒的动画 ...· 2 天前

爱可可-爱生活 · 【SRTK: ...· 4 天前

爱可可-爱生活 · 【大数据已死：对当前大数据概念的批判与分析， ...· 5 天前

今天看啥 › 专栏 › 机器之心

DiT架构大一统：一个框架集成图像、视频、音频和3D生成，可编辑、能试玩

机器之心 · 公众号 · AI · 2024-05-12 12:16

机器之心报道编辑：杜伟、大盘鸡基于 Diffusion Transformer（DiT）又迎来一大力作「Flag-DiT」，这次要将图像、视频、音频和 3D「一网打尽」。今年 2 月初，Sora 的发布让 AI 社区更加看到了基础扩散模型的潜力。连同以往出现的 Stable Diffusion、PixArt-α 和 PixArt-Σ，这些模型在生成真实图像和视频方面取得了显著的成功。这意味着开始了从经典 U-Net 架构到基于 Transformer 的扩散主干架构的范式转变。值得注意的是，通过这种改进的架构，Sora 和 Stable Diffusion 3 可以生成任意分辨率的样本，并表现出对 scaling 定律的严格遵守，即增加参数大小可以实现更好的结果。不过，推出者们只对自家模型的设计选择提供有限的指导，并且缺乏详细的实现说明和公开的预训练检查点，限制了它们在社区使用和复刻方面的效用。并且，这些方法是针对特定任务（例如图像或 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照

分享到微博

推荐文章

机器之心 · 辅导作业这么费劲的事，还是交给这个大模型吧

昨天

爱可可-爱生活 · 百万级GPU数据中心的大规模发展时代即将到来。未来你与互联网或计-20240605080203

2 天前

黄建同学 · Transformer背后机制，30秒的动画↓#ai##chat-20240604190523

2 天前

爱可可-爱生活 · 【SRTK: 大规模知识图谱中语义相关子图检索工具，支持从大规模-20240603135403

4 天前

爱可可-爱生活 · 【大数据已死：对当前大数据概念的批判与分析，探讨了大数据技术的发-20240602145117

5 天前

人民网 · 【#王亚平答应5岁女儿摘星星回来#】翟志刚、王亚平、叶光富3名航-20211014174500

2 年前

盈科法律微观 · 盈科一日一法 | 某公司申请人格权侵害禁令，判决为何驳回？

3 年前

瞭望东方周刊 · 美国经济会否陷入“低迷十年”？

3 年前

天地一体化信息网络 · 【Satellite Life-Extension Service】诺斯罗普·格鲁曼公司成功执行在轨卫星延寿任务

4 年前

东吴双碳环保研究 · 【东吴环保袁理团队】每日锦集0206：2020年中央一号文件公布：扎实搞好农村人居环境整治

4 年前

关于移动版 · Py中国 · RSS之家 · codingpro · Code · link之家 · 卧龙AI搜索 · 藏经阁 · 小百科

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号