RESEARCH60
Data-Efficient Autoregressive-to-Diffusion Language Models via On-Policy Distillation
arXiv CS.CL·8. Juni 2026
Dieses Papier stellt das On-Policy Diffusion Language Model (OPDLM) vor, um autoregressive Modelle (ARLMs) in Diffusions-Sprachmodelle (DLMs) umzuwandeln. Es befasst sich mit Problemen wie Wissensverlust und der Diskrepanz zwischen Training und Inferenz durch den Einsatz von On-Policy Distillation (OPD).
Original lesen ↗