heapsort
RESEARCH60

SafeGene: Reusable Adapters for Transferable Safety Alignment

arXiv CS.AI·8 juin 2026

SafeGene présente un module adaptateur de sécurité réutilisable conçu pour relever le défi récurrent du maintien de l'alignement de sécurité dans les LLM open-weight affinés. Il découple les capacités de sécurité des mises à jour spécifiques aux tâches, les traitant comme une représentation d'adaptateur indépendante et transférable pour atténuer la vulnérabilité aux invites malveillantes.

Lire l'original