RESEARCH60
SafeGene: Reusable Adapters for Transferable Safety Alignment
arXiv CS.AI·8 de junho de 2026
SafeGene propõe um módulo adaptador de segurança reutilizável para resolver o problema recorrente de recuperação da segurança em LLMs de código aberto ajustados. Ele trata a capacidade de segurança como uma representação de adaptador independente e transferível, desacoplada das atualizações específicas da tarefa, para mitigar a vulnerabilidade a prompts maliciosos.
Ler original ↗