准确来说,Sinkhorn在实现上有两种策略,一个是在log space上迭代(也就是上图所示),一个是直接迭代 。一般来说后一种实现出来的计算效率更高一些。那么Sinkhorn算法有什么理论保证呢?最近的一篇文章中,[Altschuler et al. 2017]给出了一个不错的结果,如果
,并且 ,Sinkhorn可以在 的迭代次数得到一个近似解 使得
并且
[Altschuler et al. 2017]进一步指出,给定任意的 只要选取合适的 ,我们可以在 的时间(near-linear)产生 -guarantee in objective, -guarantee in constraints的解。然而Sinkhorn存在两个主要问题使得它在现实中很难得到这样的性能:
Cuturi, Marco. "Sinkhorn distances: Lightspeed computation of optimal transport." Advances in neural information processing systems. 2013.
Altschuler, Jason, Jonathan Weed, and Philippe Rigollet. "Near-linear time approximation algorithms for optimal transport via Sinkhorn iteration." Advances in Neural Information Processing Systems. 2017.
Bregman ADMM
近似求解OT还有一个不太为人了解的方法,这个方法据我所知是[Wang and Banerjee, 2014]最早提出的。然而因为文章本身并不是主要服务于OT的literature,而且证明的理论结果比较general(复杂),很少被人提及。方法的基本想法类似经典的ADMM,先把原问题写成等价的如下问题:
然后给最后一个等式约束做method of multiplier:
于是得到一下算法:
这个方法也是有理论bound的,具体来说我们定义那么我们有
以及
其中 。
相关文献:
Wang, Huahua, and Arindam Banerjee. "Bregman alternating direction method of multipliers." Advances in Neural Information Processing Systems. 2014.
Ye, Jianbo, et al. "Fast discrete distribution clustering using Wasserstein barycenter with sparse support." IEEE Transactions on Signal Processing 65.9 (2017): 2317-2332.
Ye, Jianbo, James Z. Wang, and Jia Li. "A Simulated Annealing Based Inexact Oracle for Wasserstein Loss Minimization." International Conference on Machine Learning. 2017.
Xie, Yujia, et al. "A Fast Proximal Point Method for Wasserstein Distance." arXiv preprint arXiv:1802.04307(2018).
在Sinkhorn或者B-ADMM的框架下,这个经典问题都可以得到有效求解。在Sinkhorn框架下,[Benamou et al., 2015]提出iterative Bregman projection来求解WBC,在B-ADMM框架下[Ye et al. 2017]提出的WBC办法可以用来解决在Wasserstein space类似K-means的问题。
Ye, Jianbo, et al. "Fast discrete distribution clustering using Wasserstein barycenter with sparse support." IEEE Transactions on Signal Processing 65.9 (2017): 2317-2332.
Benamou, Jean-David, et al. "Iterative Bregman projections for regularized transportation problems." SIAM Journal on Scientific Computing 37.2 (2015): A1111-A1138.