RESEARCH27
Fast Log-Domain Sinkhorn Optimal Transport with Warp-Level GPU Reductions
arXiv CS.LG·5 de mayo de 2026
Este artículo presenta FastSinkhorn, una implementación CUDA nativa del algoritmo de Sinkhorn en el dominio logarítmico, que ofrece soluciones más rápidas y estables para problemas de transporte óptimo (OT). Logra una aceleración de 12x sobre la biblioteca POT y 5.9x sobre las bases de PyTorch aceleradas por GPU, manteniendo la estabilidad numérica para pequeños parámetros de regularización.
Leer original ↗