heapsort
RESEARCH60

SafeGene: Reusable Adapters for Transferable Safety Alignment

arXiv CS.AI·8 de junio de 2026

SafeGene propone un módulo adaptador de seguridad reutilizable para abordar el desafío recurrente de mantener la alineación de seguridad en LLMs de código abierto ajustados. Desacopla las capacidades de seguridad de las actualizaciones específicas de tareas, tratándolas como una representación de adaptador independiente y transferible para mitigar la vulnerabilidad a las indicaciones maliciosas.

Leer original