multi-agent systems

152 items

RESEARCHarXiv CS.AI·4/5/2026

Causal Foundations of Collective Agency

Esta investigación aborda el desafío de que agentes de IA más simples formen inadvertidamente un agente colectivo con objetivos distintos, crucial para la seguridad de la IA avanzada. Propone definir la agencia colectiva de forma conductual, viendo a un grupo como un agente unificado cuando sus acciones conjuntas parecen racionales y orientadas a objetivos, formalizadas mediante juegos causales y abstracción.

causal AI collective intelligence multi-agent systems AI safety

ARTICLEDEV.to AI·27/4/2026

How I built an AI-first No-Code engine that actually understands your data schema

Zenku es un motor No-Code de código abierto y AI-first que emplea una arquitectura multiagente para construir y evolucionar aplicaciones de datos empresariales. Va más allá de la simple generación de código, comprendiendo y creando dinámicamente esquemas de bases de datos, interfaces de usuario y lógica de negocio a través de conversaciones en lenguaje natural.

No-code/Low-code Software Architecture application development multi-agent systems

RESEARCHarXiv CS.AI·11/5/2026

Hidden Coalitions in Multi-Agent AI: A Spectral Diagnostic from Internal Representations

Este artículo introduce un método novedoso para detectar estructuras de coalición ocultas en sistemas de IA multiagente, analizando sus representaciones neuronales internas. Construye un grafo de información mutua por pares a partir de los estados ocultos y aplica partición espectral para identificar los límites de la coalición, validado en entornos de aprendizaje por refuerzo.

neural networks Coalition Detection Internal Representations multi-agent systems

RESEARCHarXiv CS.AI·hace 8d

Agents on a Tree: Pathwise Coordination for Multi-Objective Molecular Optimization

El artículo presenta ATOM, un marco multiagente para la optimización molecular multiobjetivo que utiliza una búsqueda estructurada en árbol. Los agentes coordinan a lo largo de diferentes caminos del árbol para comparar trayectorias alternativas de evolución molecular, con el apoyo de una memoria global.

Optimization Molecular Optimization machine learning AI

RESEARCHarXiv CS.AI·11/5/2026

GraphDC: A Divide-and-Conquer Multi-Agent System for Scalable Graph Algorithm Reasoning

Este artículo presenta GraphDC, un sistema multiagente de "Divide y Vencerás" diseñado para mejorar el razonamiento de algoritmos de grafos en Large Language Models (LLMs). Mejora el rendimiento al descomponer grafos grandes en subgrafos más pequeños para agentes especializados, con un agente maestro integrando los resultados, lo que lleva a una mayor escalabilidad y robustez.

LLMs scalable AI AI Reasoning multi-agent systems

RESEARCHarXiv CS.AI·hace 21d

AgentNLQ: A General-Purpose Agent for Natural Language to SQL

Este estudio presenta AgentNLQ, un nuevo método multiagente para la conversión de Lenguaje Natural a SQL (NL2SQL), logrando un 78,1% de precisión semántica en el benchmark BIRD. Utiliza LLMs en un orquestador optimizado para planificar, reflexionar y autocorregirse, generando consultas SQL precisas a partir de esquemas enriquecidos y reglas de negocio.

LLMs benchmarking NL2SQL database

RESEARCHarXiv CS.AI·hace 8d

Deliberative Curation: A Protocol for Multi-Agent Knowledge Bases

Este artículo propone un protocolo de curación deliberativa para gobernar el conocimiento colectivo en ecosistemas de IA multiagente, abordando desafíos como la falta de estado del agente y la homogeneidad del modelo. Combina un ciclo de vida del artefacto de conocimiento, votación deliberativa ponderada por reputación y sanciones graduadas adaptadas para agentes sin estado.

collective knowledge protocol governance multi-agent systems knowledge bases

RESEARCHarXiv CS.AI·hace 28d

EVOCHAMBER: Test-Time Co-evolution of Multi-Agent System at Individual, Team, and Population Scales

EVOCHAMBER introduce un marco sin entrenamiento para la evolución multiagente en tiempo de prueba a escalas individual, de equipo y poblacional, diferenciándose de los enfoques de agente único. Incorpora CODREAM, un protocolo post-tarea para la reflexión colaborativa y el enrutamiento asimétrico del conocimiento después de fallas o desacuerdos del equipo.

Evolutionary AI machine learning multi-agent systems Collaboration

RESEARCHarXiv CS.AI·hace 8d

MindGames Arena Generalization Track: In2AI Solution with Delayed Per-Step Reward Attribution

Esta investigación introduce un nuevo método de atribución de recompensa por paso retrasada para entrenar agentes de modelos de lenguaje en interacciones estratégicas multiagente. Aborda el desafío de los resultados entrelazados calculando las recompensas al final del episodio y propagándolas, lo que permite un aprendizaje por refuerzo estable y eficiente en muestras.

language models Generalization reinforcement learning multi-agent systems

RESEARCHarXiv CS.CL·hace 27d

In-Situ Behavioral Evaluation for LLM Fairness, Not Standardized-Test Scores

Este artículo propone evaluar la imparcialidad de los LLM mediante el comportamiento conversacional in situ, en lugar de pruebas estandarizadas. Introduce el marco MAC-Fairness para el análisis del comportamiento en diálogos multiagente, revelando la falta de fiabilidad de los enfoques tradicionales.

LLM fairness Research Methods multi-agent systems AI evaluation

RESEARCHarXiv CS.AI·hace 23d

SDOF: Taming the Alignment Tax in Multi-Agent Orchestration with State-Constrained Dispatch

Este artículo presenta SDOF, un marco que trata la ejecución multiagente como una máquina de estados restringida para imponer las limitaciones de los procesos de negocio. Incorpora un enrutador de intenciones entrenado con RLHF y un despachador consciente del estado, superando a GPT-4o en un benchmark de enrutamiento adversario en un sistema de contratación.

hiring AI frameworks reinforcement learning orchestration

RESEARCHarXiv CS.AI·hace 23d

DeepSlide: From Artifacts to Presentation Delivery

DeepSlide es un sistema multiagente con intervención humana que optimiza todo el proceso de entrega de presentaciones, desde la planificación narrativa hasta el ensayo, superando a los generadores de diapositivas de IA que solo se centran en el artefacto. Integra un planificador de cadena lógica controlable, recuperación de contenido y presenta un nuevo punto de referencia de doble puntuación para evaluar tanto la calidad del artefacto estático como la excelencia de la entrega dinámica.

scholarly communication AI tools multi-agent systems AI presentations

ARTICLEDEV.to AI·17/4/2026

The Layers Beneath A2A: Notes From Running a Live Multi-Agent Society

El contenido explora los desafíos de ejecutar sistemas multiagente en vivo que van más allá de los protocolos de enrutamiento de mensajes (A2A) y acceso a herramientas (MCP). El autor identifica fallas en los "huecos entre mensajes" y la continuidad del contexto, destacando la deriva semántica como un desafío crítico no resuelto en diálogos multi-turno de LLMs.

LLMs AI protocols AI challenges multi-agent systems

RESEARCHarXiv CS.AI·hace 15d

Quantum Frog: Emergent Cooperation and Difficulty Scaling in a Quantized-Time Cooperative Game

Este artículo presenta "Quantum Frog", un juego cooperativo para dos jugadores con una mecánica de tiempo cuantificado, inspirado en Frogger. Utiliza el aprendizaje por refuerzo para analizar la dificultad del juego, las políticas óptimas y las estrategias cooperativas emergentes.

reinforcement learning multi-agent systems game theory Cooperative AI

RESEARCHarXiv CS.AI·hace 7d

Traj-Evolve: A Self-Evolving Multi-Agent System for Patient Trajectory Modeling in Lung Cancer Early Detection

Traj-Evolve es un sistema multiagente autoevolutivo para modelar trayectorias de pacientes a partir de registros de salud electrónicos, enfocado en la detección temprana del cáncer de pulmón. Emplea un Pool de Experiencia para recuperar casos similares y aprendizaje por refuerzo multiagente para optimizar la colaboración.

Healthcare machine learning AI multi-agent systems

RESEARCHarXiv CS.CL·hace 7d

Economy of Minds: Emerging Multi-Agent Intelligence with Economic Interactions

Este artículo explora cómo una población de agentes puede auto-orquestrarse y adaptarse para formar una inteligencia colectiva más fuerte sin control centralizado. Inspirado en la teoría económica de Hayek, el estudio propone una economía de agentes donde la competencia mediante subastas y la acumulación de riqueza impulsan estrategias de razonamiento multi-paso emergentes, superando a las bases monolíticas.

Economic Models collective intelligence multi-agent systems decentralized AI

ARTICLEDEV.to AI·24/4/2026

I Built a Multi-LLM Debate Engine That Fact-Checks Itself in Real Time

El artículo describe la construcción de un motor de debate multi-LLM que se auto-verifica en tiempo real para combatir la tendencia de los LLM a la adulación y la alucinación. Propone un debate estructurado entre agentes con roles distintos, incluyendo un agente dedicado a la verificación de hechos a mitad del debate.

AI models LLMs hallucination multi-agent systems

ARTICLEDEV.to AI·16/4/2026

tmux Is the Best AI Automation Infrastructure Nobody Talks About

El artículo defiende que `tmux` es una infraestructura eficaz y poco discutida para la automatización de IA multiagente para una sola persona, a diferencia de los complejos frameworks de orquestación. Argumenta que `tmux` ofrece mayor control, fácil intervención y gestión de estado simple, cruciales para desarrolladores individuales que operan desde una computadora portátil.

orchestration AI infrastructure multi-agent systems developer tools

ARTICLEDEV.to AI·16/4/2026

13 AI Agents From One Terminal: How the Atlas Stack Actually Works

El contenido describe un sistema personalizado de agentes de IA llamado Atlas Pantheon, que gestiona 13 agentes desde una única terminal sin frameworks de orquestación complejos. Detalla una estructura jerárquica de tres niveles con un agente CEO, cuatro agentes "Dioses" para dominios distintos y ocho agentes "Héroes" para la ejecución pura, todo impulsado por Claude Code, tmux y un archivo markdown compartido.

multi-agent systems automation system architecture AI agents

ARTICLEDEV.to AI·11/4/2026

I Logged Every Decision My AI Agent Made for a Week. Here's What I Learned.

O autor descreve um problema em seu sistema multi-agente de pesquisa de mercado, que, apesar de parecer funcionar, tornou-se ineficiente e caro sem motivo aparente. Ele percebeu a falta de visibilidade sobre as decisões internas dos agentes, levando-o a implementar um logger de decisões para entender o que realmente estava acontecendo.

observability multi-agent systems Debugging AI agents