RESEARCH27

LEAP: Unlocking dLLM Parallelism via Lookahead Early-Convergence Token Detection

arXiv CS.LG·13. Mai 2026

Diffusions-Sprachmodelle (dLLMs) stoßen aufgrund übermäßig konservativer Konfidenzschwellen, die ihr Potenzial für hochparallele Verarbeitung einschränken, an Skalierbarkeitsgrenzen im Parallelismus. Dieses Papier stellt LEAP vor, eine trainingsfreie Plug-and-Play-Methode, die den dLLM-Parallelismus durch Erkennung früh konvergierender Token verbessert und somit die Dekodierung beschleunigt.

Diffusion Models Parallel Computing AI large language models model optimization

Original lesen ↗