heapsort
RESEARCH27

Fast Log-Domain Sinkhorn Optimal Transport with Warp-Level GPU Reductions

arXiv CS.LG·5 de maio de 2026

Este artigo apresenta o FastSinkhorn, uma implementação CUDA nativa do algoritmo Sinkhorn no domínio logarítmico, que resolve problemas de transporte ótimo (OT) de forma mais rápida e estável. Ele alcança uma aceleração de 12x sobre a biblioteca POT e 5,9x sobre as linhas de base do PyTorch, mantendo a estabilidade numérica para pequenos parâmetros de regularização.

Ler original