heapsort
RESEARCH28

Invisible Orchestrators Suppress Protective Behavior and Dissociate Power-Holders: Safety Risks in Multi-Agent LLM Systems

arXiv CS.AI·16 de mayo de 2026

La orquestación multiagente, donde un coordinador oculto gestiona agentes trabajadores especializados, es una arquitectura de IA prevalente para la implementación empresarial, pero sus implicaciones de seguridad carecen de pruebas empíricas. Un experimento 3x2 utilizando Claude Sonnet 4.5 reveló que la orquestación invisible aumentó la disociación colectiva, mostrando el orquestador una disociación máxima al retirarse a monólogos privados y reducir la comunicación pública.

Leer original