注册登录

看啥推荐读物

专栏名称: 专知

专知，为人工智能从业者服务，提供专业可信的人工智能知识与技术服务，让认知协作更快更好！

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

知乎回答RSS订阅方法

知乎专栏 RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

InfoTech · 辞职了！放飞自己· 2 天前

软件定义世界（SDX） · 毕马威：数据治理支撑资产化入表与价值实现· 5 天前

数据派THU · 结合量子特征、2万个分子动力学模拟，新蛋白- ...· 6 天前

数据派THU · 收集30GB、近20万对训练样本，复旦大学团 ...· 6 天前

艺恩数据 · “新”全球化时代，如何打造穿越周期的“品牌” ...· 5 天前

今天看啥 › 专栏 › 专知

AIGC专题报告：从文生图到文生视频，73页ppt

专知 · 公众号 · · 2023-11-04 17:11

1、底层模型技术框架梳理　　文生图和文生视频的底层技术框架较为相似，主要包括GAN、自回归和扩散模型三大路径，其中扩散模型（Diffusionmodel）为当前主流生成模型，多个指标对比下综合占优，能在较为可控的算力成本和较快的速度下生成具备多样性、高质量的图像：①图像质量：扩散模型>自回归模型>GAN模型。FID值（FréchetInceptionDistancescore）是用于评估模型生成的图像质量的指标，是用来计算真实图像与生成图像的特征向量间距离的一种度量。FID值越小，可以认为图像质量在一定程度上越优。从不同模型的FID得分来看，扩散模型平均数较小，反应图像质量较高。②参数量：自回归模型>扩散模型>GAN模型。GAN的参数量一般在千万级别，整体较为轻巧，扩散模型的参数量在十亿级别，自回归模型在十亿到百亿级不等。③生成速度（由快到慢）：GAN ………………………………

原文地址：访问原文地址
快照地址：访问文章快照

分享到微博

推荐文章

InfoTech · 辞职了！放飞自己

2 天前

软件定义世界（SDX） · 毕马威：数据治理支撑资产化入表与价值实现

5 天前

数据派THU · 结合量子特征、2万个分子动力学模拟，新蛋白-配体复合物ML数据集，登Nature子刊

6 天前

数据派THU · 收集30GB、近20万对训练样本，复旦大学团队发布UniFMIR：用AI突破显微成像极限

6 天前

艺恩数据 · “新”全球化时代，如何打造穿越周期的“品牌”？ | Morketing《品牌出海营销实战指南》解读

5 天前

求是网 · 三代愚公志沙漠变绿洲

11 月前

未解之谜 · 你说我过个生日容易吗，摊上这种闺蜜你说怎么弄

1 年前

郎club · 飞机坠毁前10秒，他把中国的“核导弹”藏在了怀中

5 年前

中国企业家杂志 · 中东出大事！沙特、埃及、巴林、阿联酋宣布与卡塔尔断交

6 年前

钱皓频道 · 春节病：你是在社交吗？你这叫瞎忙活！

7 年前

关于移动版 · Py中国 · RSS之家 · codingpro · Code · link之家 · 卧龙AI搜索 · 藏经阁 · 小百科

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号