← heapsort-ai

Formal verification

8 items

RESEARCHarXiv CS.AI·vor 1T

Lean4Agent: Formal Modeling and Verification for Agent Workflow and Trajectory

Das Papier stellt Lean4Agent vor, ein Framework, das Lean4 zur formalen Modellierung und Verifizierung des Agentenverhaltens, insbesondere bei LLM-gesteuerten Mehrschritt-Workflows, einsetzt. Es adressiert den Mangel an formalen Methoden in aktuellen Agentensystemen, indem es semantische Konsistenzprüfungen und die Lokalisierung von Laufzeitfehlern ermöglicht.

60
RESEARCHarXiv CS.LG·4/22/2026

Compile to Compress: Boosting Formal Theorem Provers by Compiler Outputs

Diese Forschung stellt ein neuartiges Lern-zu-Verfeinern-Framework vor, um die prohibitiv hohen Rechenkosten von großen Sprachmodellen (LLMs) beim formalen Theorembeweisen zu adressieren. Durch die Nutzung von Compiler-Ausgaben, die diverse Beweisversuche in strukturierte Fehlermodi komprimieren, ermöglicht die Methode eine effiziente Beweiserkundung und lokale Fehlerkorrektur, wodurch die Denkfähigkeiten der Basisprufer erheblich verstärkt werden.

27
RESEARCHDEV.to AI·vor 19T

Paper 154 v0.0 (OUTLINE) — Rei as a Formal-Verification Compilation Pass for AI-Generated Mathematics

Dies ist ein v0.0-Entwurf des Papiers 'Rei as a Formal-Verification Compilation Pass for AI-Generated Mathematics', das Reis Vorschlag als formale Verifikations-Kompilationsphase für KI-generierte Hypothesen erläutert. Die aktuelle Validierung befindet sich im Gerüst-Level-Smoke-Run-Stadium, wobei eine vollständige Demonstration für die v0.1-Promotion noch aussteht.

27
RESEARCHarXiv CS.AI·5/6/2026

Algebraic Semantics of Governed Execution: Monoidal Categories, Effect Algebras, and Coterminous Boundaries

Dieses Papier stellt eine algebraische Semantik für die gesteuerte Ausführung vor, die auf Interaktionsbäumen und parametrisierter Koinuktion basiert und in Rocq mechanisiert wurde. Der Rahmen führt eine GovernanceAlgebra ein, die eine symmetrische monoidale Kategorie und ein algebraisches Effektsystem induziert, das governance-erhaltende Handler sicherstellt.

27
RESEARCHarXiv CS.AI·vor 15T

NeuroNL2LTL: A Neurosymbolic Framework for Natural Language Translation of Linear Temporal Logic

NeuroNL2LTL ist eine neurosymbolische Architektur, die gelernte Übersetzung mit formaler Verifikation vereint, um natürliche Sprache in Lineare Temporale Logik zu übersetzen. Sie nutzt ein Training mit Verifizierer im Regelkreis, bei dem Verifikationsergebnisse als Belohnungssignale für Verstärkungslernen dienen, um die formale Korrektheit zu optimieren.

27