RESEARCH27
Fast Log-Domain Sinkhorn Optimal Transport with Warp-Level GPU Reductions
arXiv CS.LG·5 de maio de 2026
Este artigo apresenta o FastSinkhorn, uma implementação CUDA nativa do algoritmo Sinkhorn no domínio logarítmico, que resolve problemas de transporte ótimo (OT) de forma mais rápida e estável. Ele alcança uma aceleração de 12x sobre a biblioteca POT e 5,9x sobre as linhas de base do PyTorch, mantendo a estabilidade numérica para pequenos parâmetros de regularização.
Ler original ↗