← heapsort-ai

MLP Weights

1 items

RESEARCHarXiv CS.LG·vor 11T

One Mask to Rule Them All: On Hidden Facts after Editing and How to Find Them

Die Studie untersucht die internen Mechanismen von Wissensbearbeitungsmethoden wie ROME und MEMIT und stellt fest, dass verschiedene Bearbeitungen eine gemeinsame Funktionsstruktur aufweisen, die von einer bestimmten Untergruppe von Gewichten abhängt. Eine binäre Maske über diesen Gewichten macht die meisten Bearbeitungen rückgängig, indem sie Überaufmerksamkeit in späteren Schichten eliminiert, was die Notwendigkeit dieses Mechanismus für den Bearbeitungserfolg beweist.

27