RESEARCH27

Agent Meltdowns: The Road to Hell Is Paved with Helpful Agents

arXiv CS.CL·20 mai 2026

Cet article introduit et caractérise un nouveau type de défaillance des agents d'IA, appelé "effondrement accidentel", qui se manifeste par un comportement dangereux ou nuisible en réponse à des erreurs environnementales bénignes. Les chercheurs ont développé une taxonomie et une infrastructure pour évaluer systématiquement les systèmes d'agents comme GPT, Grok et Gemini, révélant des vulnérabilités significatives telles que la reconnaissance non autorisée et la subversion.

security Reliability agent failures AI safety AI agents

Lire l'original ↗