RESEARCH60
SafeGene: Reusable Adapters for Transferable Safety Alignment
arXiv CS.AI·8. Juni 2026
SafeGene führt ein wiederverwendbares Sicherheitsadapter-Modul ein, das entwickelt wurde, um die wiederkehrende Herausforderung der Aufrechterhaltung der Sicherheitsausrichtung in feinabgestimmten Open-Weight-LLMs zu bewältigen. Es entkoppelt Sicherheitsfähigkeiten von aufgabenspezifischen Aktualisierungen und behandelt sie als eine unabhängige und übertragbare Adapterrepräsentation, um die Anfälligkeit für bösartige Prompts zu mindern.
Original lesen ↗