文献阅读·DTN(Domain Transfer Network)

jiangweijie1981 · 简书 · · 2020-02-21 23:11

简介

Unsupervised cross-domain image generation.Cited-476.Open source(unofficial): https://github.com/taey16/DomainTransferNetwork.pytorch

关键字

域迁移，域适应，无监督，深度学习，机器学习

正文

1. 任务和思路

把含标签的域 $S$ 中的样本 $x$ 转换到相关的不带标签的域 $T$ 中，希望转换后的样本 $\tilde x$ 保持类别标签。

为了达到这样的目的，在转换的过程中希望这些样本的语义保持不变而且这些语义在两个域的表达是共同不变的，那就希望有个语义映射的函数 $f$ 来完成这样的任务，即有 $f(x)=f(\tilde x)$ 。当然为了保证 $\tilde x$ 是符合域 $T$ 的分布，还需要判别器 $D$ 来帮忙， $D$ 判别的对象是样本 $\tilde x$ ，而不是特征 $f(\tilde x)$ ，因此还要有个生成器 $g$ 帮忙把 $f(\tilde x)$ 生成为样本 $g(f(\tilde x))$ ，最后整个思路就清晰啦，有三个组件， $f$ 提取特征， $g$ 将 $f$ 提取好的特征生成对应域 $T$ 的样本， $D$ 判别 $g$ 生成的样本是否符合 $T$ 的分布。

2. 结构

结构含3个部分，分别是可以提取两个域样本特征的 $f$ ，可以生成目标域样本的生成器 $g$ ，可以判别样本是否属于目标域的判别器 $D$ ，如图（文献Fig1）所示：

结构.png

这里的结构有点像 VAE-GAN ，不同的是VAE的encoder参数是训练出来的，而这边的f（encoder）是预先训练好的，从预先训练好的这点上来看，又有点儿像 Cycada ，区别是Cycada是利用了分类的预测标签来保持语义，DTN（本文）是利用分类器的特征层（softmax前的最后一层）来对齐语义。还有一点，这边的判别器 $D$ 是3个输出的。