专栏名称: AINLP

关注AI、NLP相关技术，关注算法研发职位和课程；回复"文章"获取历史信息；双语聊天机器人"无名"；中英翻译请输入：翻译翻译内容；自动对联，请输入：上联上联内容；调戏夸夸聊天机器人，请求夸、求赞；查询相似词，请输入: 相似词词条

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词RSS订阅方法

知网期刊RSS订阅方法

即刻RSS订阅方法

一文详解AutoEncoder在图像生成和多模态大模型中的应用

AINLP · 公众号 · · 2024-07-16 10:10

文章预览

作者：vasgaowei 链接：https://zhuanlan.zhihu.com/p/681895334 本文主要介绍AutoEncoder在图像生成（主要是自回归图像生成）以及多模态大模型中的应用。 VAE 《Auto-Encoding Variational Bayes》 https://arxiv.org/pdf/1312.6114 更多数学推导可以参见博客 VAE-1 (https://mbernste.github.io/posts/vae/) VAE-2 (https://lilianweng.github.io/posts/2018-08-12-vae/#vae-variational-autoencoder) VAE-3 (https://jaan.io/what-is-variational-autoencoder-vae-tutorial/) VAE-4 (https://liambai.com/variational-autoencoder/) VAE-5 (https://www.jeremyjordan.me/variational-autoencoders/) VQ-VAE 《Neural Discrete Representation Learning》示NeurIPS 2017的一篇文章。 https://arxiv.org/abs/1711.00937 https://avdnoord.github.io/homepage/vqvae/ 理解VQ-VAE就看下面这张图。 Fig 1 首先是有一个隐特征空间，输入经过一个encoder得到特征编码，通过look-up的方式从隐特征空间找对应关系， Fig 2 而输入可以用隐特 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博