Verification

12 items

RESEARCHarXiv CS.LG·vor 20Std

When Should an AI Scientist Stop? Verifiable Experiment Steering and Refusal for Autonomous Discovery

Dieser Artikel stellt CARTOGRAPH vor, eine Verifizierungsschicht für KI-Wissenschaftler, die Experimentsteuerung, Ambiguitätsauflösung und die Erkennung von Bibliotheksdefiziten kombiniert. Es übertrifft rohe Projektionsmethoden in Tests und identifiziert sowie widerruft erfolgreich pharmakokinetische Mechanismen außerhalb der Bibliothek, wodurch die autonome Entdeckung verbessert wird.

experiment steering machine learning autonomous discovery Verification

ARTICLE↑ trendingHacker News (AI)·vor 14T

Agile V: Turning AI Agents into Verifiable Engineering Systems

Agile V schlägt ein Framework vor, um KI-Agenten in robuste, verifizierbare technische Systeme zu verwandeln. Es zielt darauf ab, traditionelle Software-Engineering-Prinzipien auf die KI-Entwicklung anzuwenden, um Zuverlässigkeit und Verantwortlichkeit zu gewährleisten.

Reliability AI Systems Verification Software engineering

RESEARCHarXiv CS.AI·vor 5T

Toward Pre-Deployment Assurance for Enterprise AI Agents: Ontology-Grounded Simulation and Trust Certification

Dieses Papier schlägt ein ontologiebasiertes Verifizierungsframework für Unternehmens-KI-Agenten vor, das die kritische Lücke bei der Vorab-Bereitstellungsabsicherung schließt. Das Framework umfasst eine formale Beschreibung des Zertifizierungsbereichs, eine Pipeline zur Szenariengenerierung aus Ontologien und ein Vertrauenszertifikat mit maschinell überprüfbaren Bestätigungen für Bereitstellungsentscheidungen.

security Trust Verification AI agents

RESEARCHarXiv CS.LG·4/22/2026

The Cost of Relaxation: Evaluating the Error in Convex Neural Network Verification

Diese Forschung bewertet die Worst-Case-Divergenz zwischen ursprünglichen neuronalen Netzen und ihren konvexen Relaxationen, die in Verifikationssystemen zur Leistungssteigerung auf Kosten der Gültigkeit eingesetzt werden. Die Studie liefert analytische obere und untere Schranken für den Fehler, der exponentiell mit der Netzwerktiefe und linear mit dem Eingaberadius wächst.

robustness neural networks mathematical analysis Verification

DOCDEV.to AI·5/1/2026

Stop Your RAG Pipeline From Hallucinating: A 15-Line Fix published

Dieser Artikel stellt eine 15-zeilige Lösung vor, um Halluzinationen in RAG-Pipelines zu bekämpfen, selbst wenn die Antworten auf abgerufenen Dokumenten zu basieren scheinen. Er beschreibt ein „abrufen → generieren → verifizieren“-Muster, um Fehler zu erkennen, bevor der KI-Agent handelt.

hallucination AI quality RAG Verification

ARTICLEDEV.to AI·4/20/2026

agent-consistency – a Python consistency layer for multi-agent workflows

Der Autor weist auf häufige Probleme in KI-Agenten-Workflows hin, wie veraltete Zustände und unvollständige Ergebnisverifizierung. Er stellt `agent-consistency` vor, ein MIT-lizenziertes Python-Paket, um diese Herausforderungen anzugehen und bittet um Feedback zu seinem Ansatz.

workflow automation consistency Verification Python

RESEARCHarXiv CS.LG·4/27/2026

Kernel Contracts: A Specification Language for ML Kernel Correctness Across Heterogeneous Silicon

Diese Forschung schlägt eine Spezifikationssprache für ML-Kernel-Verträge vor, um deren erwartetes Verhalten auf heterogenen Siliziumplattformen formal zu definieren. Sie stellt eine achtteilige Vertragsstruktur und zwölf Vertragsklassen vor, um Streitigkeiten bezüglich Präzision, Reihenfolge oder anderer Fehlermodi zu schlichten.

machine learning Verification Software engineering

RESEARCHarXiv CS.LG·vor 27T

Vertex-Softmax: Tight Transformer Verification via Exact Softmax Optimization

Die Arbeit stellt Vertex-Softmax vor, eine neue Methode zur zertifizierten Verifikation von Transformer-Aufmerksamkeit durch exakte Softmax-Optimierung. Es wird bewiesen, dass das exakte Optimum an einem Eckpunkt des Beschränkungsbereichs erreicht wird, was eine engere obere Schranke liefert.

Optimization machine learning Verification AI

RESEARCHarXiv CS.AI·vor 26T

Think Twice, Act Once: Verifier-Guided Action Selection For Embodied Agents

Dieser Artikel schlägt Verifier-Guided Action Selection (VegAS) vor, ein Test-Framework zur Verbesserung der Robustheit von MLLM-basierten verkörperten Agenten. Es verwendet einen generativen Verifizierer, um die zuverlässigste Aktionswahl aus einer Reihe von Kandidaten zu identifizieren.

robustness MLLM embodied agents Verification

ARTICLEDEV.to AI·vor 8T

Stop Building CI Pipelines For Humans. Your AI Agents Need A Harness.

Der Artikel argumentiert, dass traditionelle CI-Pipelines, die für menschliche Überprüfung konzipiert sind, für KI-Agenten aufgrund ihres Mangels an Intuition für potenzielle Probleme unzureichend sind. Er schlägt ein "Verifizierungs-Harness" für KI-Agenten vor, das deterministische Infrastruktur und ephemere Vorschauumgebungen umfasst, um sie sicher in Entwicklungsworkflows zu integrieren.

CI/CD DevOps Verification Software engineering

RESEARCHarXiv CS.LG·5/6/2026

Delay, Plateau, or Collapse: Evaluating the Impact of Systematic Verification Error on RLVR

Diese Arbeit untersucht die Auswirkungen systematischer Verifikationsfehler auf das Reinforcement Learning mit verifizierbaren Belohnungen (RLVR), eine Methode zur Verbesserung der Denkfähigkeiten großer Sprachmodelle. Im Gegensatz zu früheren Analysen, die Fehler als zufällig betrachteten, zeigt diese Studie, dass systematische Fehler Modelle dazu bringen können, unerwünschtes Verhalten zu lernen. Experimente an arithmetischen Aufgaben zeigen, dass systematische falsch-negative Ergebnisse ähnliche Effekte wie zufälliges Rauschen haben, während systematische falsch-positive Ergebnisse komplexere Auswirkungen haben können.

reinforcement learning AI Errors Verification large language models

DOCDEV.to AI·vor 16T

Top 5 Best Sites To Buy Google Voice Accounts In Days

Der Inhalt beschreibt Methoden zur Beschaffung von Google Voice-Konten, einschließlich der offiziellen Registrierung und der Integration mit Google Workspace. Er erörtert die Bedeutung verifizierter Konten und bietet eine Schritt-für-Schritt-Anleitung zur Kontoerstellung.

Google Workspace Verification Google Voice Account Acquisition