RESEARCH28

Steering Without Breaking: Mechanistically Informed Interventions for Discrete Diffusion Language Models

arXiv CS.LG·13 mai 2026

Cet article examine les limites des interventions uniformes dans les modèles de langage à diffusion discrète (DLMs), démontrant qu'elles dégradent la qualité de la génération contrôlée. Les auteurs constatent que différents attributs se stabilisent à des étapes distinctes du processus de débruitage, proposant un planificateur adaptatif pour concentrer les interventions efficacement.

Diffusion Models language models Controlled Generation text generation AI Research

Lire l'original ↗