RESEARCH28
From AR to Diffusion: Efficiently Adapting Large Language Models with Strictly Causal and Elastic Horizons
arXiv CS.CL·28. Mai 2026
FLUID ist ein neues Framework, das autoregressive (AR) Backbones effizient an das Diffusionsparadigma zur parallelen Textgenerierung anpasst. Es ermöglicht die Initialisierung von GPT-Modellen und führt einen dynamischen Entrauschungsmechanismus ein, wodurch Spitzenleistungen bei erheblich reduzierten Trainingskosten erzielt werden.
Original lesen ↗