heapsort
RESEARCH27

Learning Correct Behavior from Examples: Validating Sequential Execution in Autonomous Agents

arXiv CS.AI·6 mai 2026

Un nouvel algorithme est présenté pour apprendre le comportement séquentiel correct à partir de seulement 2 à 10 traces d'exécution, validant de nouvelles exécutions chez les agents autonomes. Il combine l'analyse des dominants avec la compréhension sémantique alimentée par des LLM multimodaux pour construire un modèle de vérité généralisé, atteignant une grande précision dans la détection des bugs.

Lire l'original