RESEARCH28

Steering Without Breaking: Mechanistically Informed Interventions for Discrete Diffusion Language Models

arXiv CS.LG·13 de mayo de 2026

Este artículo investiga las limitaciones de las intervenciones uniformes en los modelos de lenguaje de difusión discreta (DLMs), mostrando que degradan la calidad de la generación controlada. Los autores descubren que diferentes atributos se consolidan en etapas distintas del proceso de denoising, proponiendo un programador adaptativo para concentrar las intervenciones de manera eficiente.

Diffusion Models language models Controlled Generation text generation AI Research

Leer original ↗