← heapsort-ai

multi-agent systems

152 items

RESEARCHarXiv CS.AI·4/5/2026

Causal Foundations of Collective Agency

Esta investigación aborda el desafío de que agentes de IA más simples formen inadvertidamente un agente colectivo con objetivos distintos, crucial para la seguridad de la IA avanzada. Propone definir la agencia colectiva de forma conductual, viendo a un grupo como un agente unificado cuando sus acciones conjuntas parecen racionales y orientadas a objetivos, formalizadas mediante juegos causales y abstracción.

27
ARTICLEDEV.to AI·27/4/2026

How I built an AI-first No-Code engine that actually understands your data schema

Zenku es un motor No-Code de código abierto y AI-first que emplea una arquitectura multiagente para construir y evolucionar aplicaciones de datos empresariales. Va más allá de la simple generación de código, comprendiendo y creando dinámicamente esquemas de bases de datos, interfaces de usuario y lógica de negocio a través de conversaciones en lenguaje natural.

27
RESEARCHarXiv CS.AI·11/5/2026

Hidden Coalitions in Multi-Agent AI: A Spectral Diagnostic from Internal Representations

Este artículo introduce un método novedoso para detectar estructuras de coalición ocultas en sistemas de IA multiagente, analizando sus representaciones neuronales internas. Construye un grafo de información mutua por pares a partir de los estados ocultos y aplica partición espectral para identificar los límites de la coalición, validado en entornos de aprendizaje por refuerzo.

27
RESEARCHarXiv CS.AI·11/5/2026

GraphDC: A Divide-and-Conquer Multi-Agent System for Scalable Graph Algorithm Reasoning

Este artículo presenta GraphDC, un sistema multiagente de "Divide y Vencerás" diseñado para mejorar el razonamiento de algoritmos de grafos en Large Language Models (LLMs). Mejora el rendimiento al descomponer grafos grandes en subgrafos más pequeños para agentes especializados, con un agente maestro integrando los resultados, lo que lleva a una mayor escalabilidad y robustez.

27
RESEARCHarXiv CS.AI·hace 21d

AgentNLQ: A General-Purpose Agent for Natural Language to SQL

Este estudio presenta AgentNLQ, un nuevo método multiagente para la conversión de Lenguaje Natural a SQL (NL2SQL), logrando un 78,1% de precisión semántica en el benchmark BIRD. Utiliza LLMs en un orquestador optimizado para planificar, reflexionar y autocorregirse, generando consultas SQL precisas a partir de esquemas enriquecidos y reglas de negocio.

27
RESEARCHarXiv CS.AI·hace 8d

Deliberative Curation: A Protocol for Multi-Agent Knowledge Bases

Este artículo propone un protocolo de curación deliberativa para gobernar el conocimiento colectivo en ecosistemas de IA multiagente, abordando desafíos como la falta de estado del agente y la homogeneidad del modelo. Combina un ciclo de vida del artefacto de conocimiento, votación deliberativa ponderada por reputación y sanciones graduadas adaptadas para agentes sin estado.

27
RESEARCHarXiv CS.AI·hace 28d

EVOCHAMBER: Test-Time Co-evolution of Multi-Agent System at Individual, Team, and Population Scales

EVOCHAMBER introduce un marco sin entrenamiento para la evolución multiagente en tiempo de prueba a escalas individual, de equipo y poblacional, diferenciándose de los enfoques de agente único. Incorpora CODREAM, un protocolo post-tarea para la reflexión colaborativa y el enrutamiento asimétrico del conocimiento después de fallas o desacuerdos del equipo.

27
RESEARCHarXiv CS.AI·hace 8d

MindGames Arena Generalization Track: In2AI Solution with Delayed Per-Step Reward Attribution

Esta investigación introduce un nuevo método de atribución de recompensa por paso retrasada para entrenar agentes de modelos de lenguaje en interacciones estratégicas multiagente. Aborda el desafío de los resultados entrelazados calculando las recompensas al final del episodio y propagándolas, lo que permite un aprendizaje por refuerzo estable y eficiente en muestras.

27
RESEARCHarXiv CS.AI·hace 23d

SDOF: Taming the Alignment Tax in Multi-Agent Orchestration with State-Constrained Dispatch

Este artículo presenta SDOF, un marco que trata la ejecución multiagente como una máquina de estados restringida para imponer las limitaciones de los procesos de negocio. Incorpora un enrutador de intenciones entrenado con RLHF y un despachador consciente del estado, superando a GPT-4o en un benchmark de enrutamiento adversario en un sistema de contratación.

27
RESEARCHarXiv CS.AI·hace 23d

DeepSlide: From Artifacts to Presentation Delivery

DeepSlide es un sistema multiagente con intervención humana que optimiza todo el proceso de entrega de presentaciones, desde la planificación narrativa hasta el ensayo, superando a los generadores de diapositivas de IA que solo se centran en el artefacto. Integra un planificador de cadena lógica controlable, recuperación de contenido y presenta un nuevo punto de referencia de doble puntuación para evaluar tanto la calidad del artefacto estático como la excelencia de la entrega dinámica.

27
ARTICLEDEV.to AI·17/4/2026

The Layers Beneath A2A: Notes From Running a Live Multi-Agent Society

El contenido explora los desafíos de ejecutar sistemas multiagente en vivo que van más allá de los protocolos de enrutamiento de mensajes (A2A) y acceso a herramientas (MCP). El autor identifica fallas en los "huecos entre mensajes" y la continuidad del contexto, destacando la deriva semántica como un desafío crítico no resuelto en diálogos multi-turno de LLMs.

27
RESEARCHarXiv CS.AI·hace 7d

Traj-Evolve: A Self-Evolving Multi-Agent System for Patient Trajectory Modeling in Lung Cancer Early Detection

Traj-Evolve es un sistema multiagente autoevolutivo para modelar trayectorias de pacientes a partir de registros de salud electrónicos, enfocado en la detección temprana del cáncer de pulmón. Emplea un Pool de Experiencia para recuperar casos similares y aprendizaje por refuerzo multiagente para optimizar la colaboración.

27
RESEARCHarXiv CS.CL·hace 7d

Economy of Minds: Emerging Multi-Agent Intelligence with Economic Interactions

Este artículo explora cómo una población de agentes puede auto-orquestrarse y adaptarse para formar una inteligencia colectiva más fuerte sin control centralizado. Inspirado en la teoría económica de Hayek, el estudio propone una economía de agentes donde la competencia mediante subastas y la acumulación de riqueza impulsan estrategias de razonamiento multi-paso emergentes, superando a las bases monolíticas.

27
ARTICLEDEV.to AI·16/4/2026

tmux Is the Best AI Automation Infrastructure Nobody Talks About

El artículo defiende que `tmux` es una infraestructura eficaz y poco discutida para la automatización de IA multiagente para una sola persona, a diferencia de los complejos frameworks de orquestación. Argumenta que `tmux` ofrece mayor control, fácil intervención y gestión de estado simple, cruciales para desarrolladores individuales que operan desde una computadora portátil.

27
ARTICLEDEV.to AI·16/4/2026

13 AI Agents From One Terminal: How the Atlas Stack Actually Works

El contenido describe un sistema personalizado de agentes de IA llamado Atlas Pantheon, que gestiona 13 agentes desde una única terminal sin frameworks de orquestación complejos. Detalla una estructura jerárquica de tres niveles con un agente CEO, cuatro agentes "Dioses" para dominios distintos y ocho agentes "Héroes" para la ejecución pura, todo impulsado por Claude Code, tmux y un archivo markdown compartido.

27