heapsort
RESEARCH60

SafeGene: Reusable Adapters for Transferable Safety Alignment

arXiv CS.AI·8. Juni 2026

SafeGene führt ein wiederverwendbares Sicherheitsadapter-Modul ein, das entwickelt wurde, um die wiederkehrende Herausforderung der Aufrechterhaltung der Sicherheitsausrichtung in feinabgestimmten Open-Weight-LLMs zu bewältigen. Es entkoppelt Sicherheitsfähigkeiten von aufgabenspezifischen Aktualisierungen und behandelt sie als eine unabhängige und übertragbare Adapterrepräsentation, um die Anfälligkeit für bösartige Prompts zu mindern.

Original lesen