RESEARCH27
Towards Verifiable Transformers: Solver-Checkable Circuit Explanations
arXiv CS.LG·26. Mai 2026
Diese Forschung stellt Verifiable Transformers vor, ein Framework zur Umwandlung aufgabenlokalisierter Transformer-Schaltungen in begrenzte, solver-prüfbare Behauptungen. Es ermöglicht die Überprüfung von Eigenschaften wie funktionale Äquivalenz und Robustheit durch direkte oder surrogat-vermittelte SMT-Kodierung.
Original lesen ↗