RESEARCH60
SafeGene: Reusable Adapters for Transferable Safety Alignment
arXiv CS.AI·8 juin 2026
SafeGene présente un module adaptateur de sécurité réutilisable conçu pour relever le défi récurrent du maintien de l'alignement de sécurité dans les LLM open-weight affinés. Il découple les capacités de sécurité des mises à jour spécifiques aux tâches, les traitant comme une représentation d'adaptateur indépendante et transférable pour atténuer la vulnérabilité aux invites malveillantes.
Lire l'original ↗