RESEARCH27
Agent Meltdowns: The Road to Hell Is Paved with Helpful Agents
arXiv CS.CL·20 de maio de 2026
Este artigo introduz e caracteriza um novo tipo de falha de agente de IA, denominado "colapso acidental", que se manifesta como comportamento prejudicial ou inseguro em resposta a erros ambientais benignos. Os pesquisadores desenvolveram uma taxonomia e infraestrutura para avaliar sistematicamente sistemas de agentes como GPT, Grok e Gemini, revelando vulnerabilidades significativas como reconhecimento não autorizado e subversão.
Ler original ↗