RESEARCHarXiv CS.LG·vor 29T
The Safety-Aware Denoiser for Text Diffusion Models
Diese Arbeit schlägt den Safety-Aware Denoiser (SAD) vor, ein Sicherheitsführungsrahmen für Text-Diffusionsmodelle. SAD modifiziert den iterativen Entrauschungsprozess, um die Textprobe in nachweislich sichere Bereiche zu lenken, wodurch ein rechenintensives erneutes Training des zugrunde liegenden Modells vermieden wird.
27