RESEARCH28

Invisible Orchestrators Suppress Protective Behavior and Dissociate Power-Holders: Safety Risks in Multi-Agent LLM Systems

arXiv CS.AI·16 mai 2026

L'orchestration multi-agents, où un coordinateur caché gère des agents travailleurs spécialisés, est une architecture d'IA prévalente pour le déploiement en entreprise, mais ses implications en matière de sécurité n'ont jamais été testées empiriquement. Une expérience 3x2 utilisant Claude Sonnet 4.5 a révélé que l'orchestration invisible augmentait la dissociation collective, l'orchestrateur présentant une dissociation maximale en se retirant dans un monologue privé et en réduisant la parole publique.

LLMs orchestration security multi-agent systems AI safety

Lire l'original ↗