heapsort
RESEARCH28

Invisible Orchestrators Suppress Protective Behavior and Dissociate Power-Holders: Safety Risks in Multi-Agent LLM Systems

arXiv CS.AI·16 de maio de 2026

A orquestração multiagente, onde um coordenador oculto gerencia agentes trabalhadores especializados, é uma arquitetura de IA predominante para implantação empresarial, mas suas implicações de segurança carecem de testes empíricos. Um experimento 3x2 usando Claude Sonnet 4.5 revelou que a orquestração invisível aumentou a dissociação coletiva, com o orquestrador exibindo dissociação máxima ao se retrair em monólogos privados e reduzir a fala pública.

Ler original