heapsort
RESEARCH27

Fast Log-Domain Sinkhorn Optimal Transport with Warp-Level GPU Reductions

arXiv CS.LG·5 de mayo de 2026

Este artículo presenta FastSinkhorn, una implementación CUDA nativa del algoritmo de Sinkhorn en el dominio logarítmico, que ofrece soluciones más rápidas y estables para problemas de transporte óptimo (OT). Logra una aceleración de 12x sobre la biblioteca POT y 5.9x sobre las bases de PyTorch aceleradas por GPU, manteniendo la estabilidad numérica para pequeños parámetros de regularización.

Leer original