RESEARCH27
Fast Log-Domain Sinkhorn Optimal Transport with Warp-Level GPU Reductions
arXiv CS.LG·5 mai 2026
Cet article présente FastSinkhorn, une implémentation CUDA native de l'algorithme de Sinkhorn en domaine logarithmique, offrant des solutions plus rapides et stables pour les problèmes de transport optimal (OT). Il atteint une accélération de 12x par rapport à la bibliothèque POT et de 5,9x par rapport aux bases de PyTorch accélérées par GPU, tout en maintenant la stabilité numérique pour de petits paramètres de régularisation.
Lire l'original ↗