Formal verification

8 items

RESEARCHarXiv CS.AI·vor 1T

Lean4Agent: Formal Modeling and Verification for Agent Workflow and Trajectory

Das Papier stellt Lean4Agent vor, ein Framework, das Lean4 zur formalen Modellierung und Verifizierung des Agentenverhaltens, insbesondere bei LLM-gesteuerten Mehrschritt-Workflows, einsetzt. Es adressiert den Mangel an formalen Methoden in aktuellen Agentensystemen, indem es semantische Konsistenzprüfungen und die Lokalisierung von Laufzeitfehlern ermöglicht.

Lean4 LLMs workflow automation Formal verification

RESEARCHarXiv CS.LG·4/22/2026

Compile to Compress: Boosting Formal Theorem Provers by Compiler Outputs

Diese Forschung stellt ein neuartiges Lern-zu-Verfeinern-Framework vor, um die prohibitiv hohen Rechenkosten von großen Sprachmodellen (LLMs) beim formalen Theorembeweisen zu adressieren. Durch die Nutzung von Compiler-Ausgaben, die diverse Beweisversuche in strukturierte Fehlermodi komprimieren, ermöglicht die Methode eine effiziente Beweiserkundung und lokale Fehlerkorrektur, wodurch die Denkfähigkeiten der Basisprufer erheblich verstärkt werden.

Scalability LLMs Theorem Proving Formal verification

RESEARCHarXiv CS.AI·4/22/2026

Formally Verified Patent Analysis via Dependent Type Theory: Machine-Checkable Certificates from a Hybrid AI + Lean 4 Pipeline

Es wird ein formal verifiziertes Framework für die Patentanalyse als hybride KI + Lean 4 Pipeline vorgestellt. Dies ist die erste bekannte Anwendung von interaktiver Theorembeweisführung auf die Analyse geistigen Eigentums, die die Schwächen bestehender Methoden überwindet.

Lean 4 Theorem Proving Formal verification AI

RESEARCHDEV.to AI·vor 19T

Paper 154 v0.0 (OUTLINE) — Rei as a Formal-Verification Compilation Pass for AI-Generated Mathematics

Dies ist ein v0.0-Entwurf des Papiers 'Rei as a Formal-Verification Compilation Pass for AI-Generated Mathematics', das Reis Vorschlag als formale Verifikations-Kompilationsphase für KI-generierte Hypothesen erläutert. Die aktuelle Validierung befindet sich im Gerüst-Level-Smoke-Run-Stadium, wobei eine vollständige Demonstration für die v0.1-Promotion noch aussteht.

Formal verification mathematics AI proofs

RESEARCHarXiv CS.AI·5/6/2026

Algebraic Semantics of Governed Execution: Monoidal Categories, Effect Algebras, and Coterminous Boundaries

Dieses Papier stellt eine algebraische Semantik für die gesteuerte Ausführung vor, die auf Interaktionsbäumen und parametrisierter Koinuktion basiert und in Rocq mechanisiert wurde. Der Rahmen führt eine GovernanceAlgebra ein, die eine symmetrische monoidale Kategorie und ein algebraisches Effektsystem induziert, das governance-erhaltende Handler sicherstellt.

monoidal categories effect algebras Formal verification algebraic semantics

RESEARCHarXiv CS.AI·vor 14T

BODHI: Precise OS Kernel Specification Inference

Dieses Papier stellt BODHI vor, eine Domänenwissens-Prompting-Methode zur Inferenz von Betriebssystemkernel-Spezifikationen, um aktuelle LLM-Einschränkungen zu überwinden. Sie erweitert den Standard-Few-Shot-Prompt mit einem strukturierten C-zu-Python-Übersetzungsleitfaden und verbessert die Automatisierung und Spezifikationsgenauigkeit.

AI models LLMs operating systems Formal verification

RESEARCHarXiv CS.LG·vor 14T

Towards Verifiable Transformers: Solver-Checkable Circuit Explanations

Diese Forschung stellt Verifiable Transformers vor, ein Framework zur Umwandlung aufgabenlokalisierter Transformer-Schaltungen in begrenzte, solver-prüfbare Behauptungen. Es ermöglicht die Überprüfung von Eigenschaften wie funktionale Äquivalenz und Robustheit durch direkte oder surrogat-vermittelte SMT-Kodierung.

AI interpretability Formal verification Transformers

RESEARCHarXiv CS.AI·vor 15T

NeuroNL2LTL: A Neurosymbolic Framework for Natural Language Translation of Linear Temporal Logic

NeuroNL2LTL ist eine neurosymbolische Architektur, die gelernte Übersetzung mit formaler Verifikation vereint, um natürliche Sprache in Lineare Temporale Logik zu übersetzen. Sie nutzt ein Training mit Verifizierer im Regelkreis, bei dem Verifikationsergebnisse als Belohnungssignale für Verstärkungslernen dienen, um die formale Korrektheit zu optimieren.

reinforcement learning Neurosymbolic AI Formal verification natural language processing