Causal Foundations of Collective Agency
Esta investigación aborda el desafío de que agentes de IA más simples formen inadvertidamente un agente colectivo con objetivos distintos, crucial para la seguridad de la IA avanzada. Propone definir la agencia colectiva de forma conductual, viendo a un grupo como un agente unificado cuando sus acciones conjuntas parecen racionales y orientadas a objetivos, formalizadas mediante juegos causales y abstracción.