heapsort
RESEARCH60

SafeGene: Reusable Adapters for Transferable Safety Alignment

arXiv CS.AI·8 de junho de 2026

SafeGene propõe um módulo adaptador de segurança reutilizável para resolver o problema recorrente de recuperação da segurança em LLMs de código aberto ajustados. Ele trata a capacidade de segurança como uma representação de adaptador independente e transferível, desacoplada das atualizações específicas da tarefa, para mitigar a vulnerabilidade a prompts maliciosos.

Ler original