← heapsort-ai

formal methods

7 items

RESEARCHarXiv CS.LG·il y a 25j

Vision-Based Runtime Monitoring under Varying Specifications using Semantic Latent Representations

Cet article étudie la surveillance certifiée en temps réel de la logique temporelle de signal (ptSTL) à partir d'observations visuelles sous observabilité partielle. Il propose un moniteur réutilisable qui déduit des quantités pertinentes pour la sécurité à partir d'images et fournit des garanties d'échantillon fini, en utilisant des représentations latentes sémantiques pour certifier des formules sans réapprentissage par formule.

28
ARTICLEDEV.to AI·il y a 23j

Designing Reliable Permission Models with Lean 4

Shrijith Venkatramana présente git-lrc, un réviseur de code basé sur l'IA, et discute de la complexité croissante des systèmes d'autorisation, en particulier avec le code généré par l'IA. Il suggère d'utiliser l'application mathématique, telle que Lean 4, pour assurer la sécurité du code généré par l'IA en rendant certains états invalides mécaniquement impossibles.

27
RESEARCHarXiv CS.LG·17/04/2026

Towards Verified and Targeted Explanations through Formal Methods

Cet article introduit ViTaX, un cadre XAI formel qui génère des explications contrefactuelles ciblées avec des garanties mathématiques. Il comble les lacunes des méthodes XAI existantes qui n'offrent pas de garanties de confiance pour les réseaux neuronaux dans des domaines critiques comme la conduite autonome et le diagnostic médical.

27
RESEARCHarXiv CS.AI·06/05/2026

Effect-Transparent Governance for AI Workflow Architectures: Semantic Preservation, Expressive Minimality, and Decidability Boundaries

Cette recherche présente une formalisation vérifiée par machine des architectures de flux de travail d'IA avec une gouvernance transparente aux effets, démontrant que la gouvernance peut être imposée sans perdre l'expressivité computationnelle. Elle définit un opérateur de gouvernance G pour médier les directives à effets telles que l'accès à la mémoire et les requêtes LLM, prouvant sept propriétés clés, y compris la complétude de Turing gouvernée et une limite de décidabilité.

27
RESEARCHarXiv CS.AI·06/05/2026

Stable Agentic Control: Tool-Mediated LLM Architecture for Autonomous Cyber Defense

L'article présente une architecture LLM médiatisée par des outils pour la cyberdéfense autonome, conçue pour offrir des garanties formelles dans la prise de décision à enjeux élevés sous pression adversaire. Il certifie la contrôlabilité, l'observabilité et la robustesse de Stabilité d'Entrée-État (ISS) via une fonction de Lyapunov vérifiée par machine, démontrant son efficacité sur des graphes d'attaque d'entreprise réels.

27