RESEARCH28

Steering Without Breaking: Mechanistically Informed Interventions for Discrete Diffusion Language Models

arXiv CS.LG·13 de maio de 2026

Este artigo investiga as limitações das intervenções uniformes em modelos de linguagem de difusão discreta (DLMs), mostrando que elas degradam a qualidade da geração controlada. Os autores descobrem que diferentes atributos se consolidam em estágios distintos do processo de denoising, propondo um agendador adaptativo para concentrar as intervenções eficientemente.

Diffusion Models language models Controlled Generation text generation AI Research

Ler original ↗