RESEARCH28

Steering Without Breaking: Mechanistically Informed Interventions for Discrete Diffusion Language Models

arXiv CS.LG·13. Mai 2026

Diese Arbeit untersucht die Einschränkungen gleichmäßiger Interventionen in diskreten Diffusions-Sprachmodellen (DLMs) und zeigt, dass diese die Qualität der gesteuerten Generierung verschlechtern. Die Autoren stellen fest, dass verschiedene Attribute zu unterschiedlichen Zeitpunkten im Denoising-Prozess fixiert werden, und schlagen einen adaptiven Planer vor, um Interventionen effizient zu konzentrieren.

Diffusion Models language models Controlled Generation text generation AI Research

Original lesen ↗