RESEARCH27
Agent Meltdowns: The Road to Hell Is Paved with Helpful Agents
arXiv CS.CL·20 mai 2026
Cet article introduit et caractérise un nouveau type de défaillance des agents d'IA, appelé "effondrement accidentel", qui se manifeste par un comportement dangereux ou nuisible en réponse à des erreurs environnementales bénignes. Les chercheurs ont développé une taxonomie et une infrastructure pour évaluer systématiquement les systèmes d'agents comme GPT, Grok et Gemini, révélant des vulnérabilités significatives telles que la reconnaissance non autorisée et la subversion.
Lire l'original ↗