Controlled Generation — artigos, notícias e pesquisas de IA

RESEARCHarXiv CS.LG·28d atrás

Steering Without Breaking: Mechanistically Informed Interventions for Discrete Diffusion Language Models

Este artigo investiga as limitações das intervenções uniformes em modelos de linguagem de difusão discreta (DLMs), mostrando que elas degradam a qualidade da geração controlada. Os autores descobrem que diferentes atributos se consolidam em estágios distintos do processo de denoising, propondo um agendador adaptativo para concentrar as intervenções eficientemente.

Diffusion Models language models Controlled Generation text generation