← heapsort-ai

model security

2 items

RESEARCHarXiv CS.AI·il y a 12j

RULER: Representation-Level Verification of Machine Unlearning

L'article présente RULER, un ensemble de métriques de vérification au niveau de la représentation pour le désapprentissage automatique, visant à supprimer l'influence d'enregistrements d'entraînement spécifiques d'un modèle. Contrairement aux évaluations actuelles basées sur la sortie, RULER détecte les résidus d'enregistrements oubliés dans les représentations intermédiaires, révélant que les méthodes de désapprentissage approximatives peuvent encore encoder des informations oubliées.

28