RESEARCH27

Fast Log-Domain Sinkhorn Optimal Transport with Warp-Level GPU Reductions

arXiv CS.LG·5. Mai 2026

Dieses Papier stellt FastSinkhorn vor, eine native CUDA-Implementierung des Log-Domain-Sinkhorn-Algorithmus, die schnellere und stabilere Lösungen für optimale Transportprobleme (OT) liefert. Es erreicht eine 12-fache Beschleunigung gegenüber der POT-Bibliothek und eine 5,9-fache Beschleunigung gegenüber GPU-beschleunigten PyTorch-Baselines, während die numerische Stabilität für kleine Regularisierungsparameter erhalten bleibt.

GPU computing deep learning Sinkhorn Algorithm Numerical Stability Optimal Transport

Original lesen ↗