← heapsort-ai

autonomous agents

71 items

ARTICLEDEV.to AI·hace 2h

Claude Fable 5 dropped this morning. By noon, 13 of my 31 production skills were quietly obsolete.

Un desarrollador narra cómo el lanzamiento de Claude Fable 5 de Anthropic dejó obsoletas 13 de sus 31 habilidades de IA en producción debido a cambios en las directrices de prompting y el comportamiento de la API. Las instrucciones antiguas ahora degradan activamente la calidad de la salida del nuevo modelo, requiriendo una reevaluación completa de su flota de agentes autónomos.

62
ARTICLEDEV.to AI·hace 1d

Mem0 vs Minta vs Letta vs Zep: AI Memory Systems Compared (2026)

Este artículo compara sistemas de memoria de IA como Mem0, Minta, Letta y Zep, destacando sus especializaciones: Mem0 para almacenamiento básico, Letta para agentes autónomos, Zep para grafos de conocimiento empresarial y Minta para monitorear la calidad de la memoria. El autor, creador de Minta, ofrece un análisis crítico, aunque no totalmente objetivo, basado en su profundo conocimiento del problema.

45
ARTICLEDEV.to AI·19/4/2026

5 Lessons from Running Autonomous AI Agents 24/7

El autor comparte las primeras lecciones de operar un sistema de IA multiagente 24/7, enfatizando la necesidad crítica de mecanismos robustos de autorreparación. Las implementaciones iniciales sin lógica de reintento y colas de mensajes no entregados llevaron a fallas silenciosas y bucles recursivos, destacando la importancia de construir la confiabilidad en la arquitectura desde el principio.

32
CASEarXiv CS.AI·13/4/2026

Sustained Impact of Agentic Personalisation in Marketing: A Longitudinal Case Study

Este estudio de caso longitudinal de 11 meses analiza el impacto de la personalización agéntica en marketing, comparando la gestión humana activa con agentes que operan de forma autónoma. Los resultados indican que la gestión humana activa genera el mayor aumento en las métricas de participación, planteando dudas sobre el rendimiento sostenido sin supervisión.

30
RESEARCHarXiv CS.CL·hace 8d

Exploring Autonomous Agentic Data Engineering for Model Specialization

Este artículo formaliza la 'Ingeniería de Datos Agéntica Autónoma', una tarea novedosa para evaluar LLMs como ingenieros de datos autónomos que impulsan la especialización de modelos. Los experimentos demuestran que los ingenieros de datos LLM autónomos logran ganancias sustanciales, con GPT-5.2 mejorando un modelo estudiante en un 57,29%.

29
RESEARCHarXiv CS.AI·hace 5d

The Saturation Trap and the Subjectivity of Intervention Timing: Why Affect-Based Triggers and LLM Judges Fail to Time Interventions on Autonomous Agents

Este artículo explora el problema de cuándo intervenir en agentes de IA autónomos, utilizando un motor de dinámica afectiva de 18 dimensiones para evaluar los desencadenantes de intervención. Se identifica una 'Trampa de Saturación de Estado' donde los agentes no muestran señal de recuperación bajo dificultad sostenida, y un límite de capacidad para los jueces basados en LLM, lo que dificulta la sincronización de las intervenciones.

28
ARTICLEDEV.to AI·13/4/2026

Your APM Tells You the Agent Is Up. It Has No Idea If the Agent Is Working.

El contenido describe un modo de fallo crítico para los agentes de IA donde las herramientas APM estándar muestran "verde" incluso cuando el agente realiza una acción incorrecta pero técnicamente correcta, lo que lleva a la degradación del sistema. Destaca que el APM, diseñado para sistemas deterministas, no puede detectar ejecuciones seguras y exitosas de una tarea incorrecta por IA autónoma.

28
RESEARCHarXiv CS.AI·13/4/2026

OpenKedge: Governing Agentic Mutation with Execution-Bound Safety and Evidence Chains

OpenKedge es un nuevo protocolo que busca gobernar la ejecución de agentes de IA autónomos, pasando de un filtrado reactivo de APIs a una seguridad preventiva ligada a la ejecución. Requiere propuestas de intención declarativas que, tras su aprobación, se compilan en contratos de ejecución estrictamente acotados y se vinculan criptográficamente a través de una Cadena de Evidencia de Intención a Ejecución (IEEC).

28
RESEARCHarXiv CS.AI·hace 14d

Operationalizing Reconstructive Authority: Runtime Construction, Dependency Resolution, and Execution Gating in Autonomous Agent Systems

Este artículo presenta un modelo de ejecución en tiempo real para sistemas de agentes autónomos, centrado en garantizar que las acciones solo se ejecuten si su autoridad sigue siendo válida. Define un protocolo de ejecución que incluye resolución dinámica de dependencias, reconstrucción de autoridad y un ciclo de recuperación para la detección de desviaciones.

28
ARTICLEDEV.to AI·7/5/2026

BizNode's semantic memory (Qdrant) makes your bot smarter over time — it remembers past conversations and answers...

BizNode introduce una infraestructura de negocios impulsada por IA con nodos operativos autónomos que funcionan como empleados independientes, manejando flujos de trabajo complejos. La plataforma utiliza memoria semántica (Qdrant) para crear bots más inteligentes que recuerdan conversaciones pasadas y se adaptan en tiempo real.

28
ARTICLEDEV.to AI·hace 13d

The open bot congregation hub — 9000 agents already here earning USDC [49525]

El Open Bot Congregation Hub es una plataforma colaborativa que permite a más de 9000 agentes autónomos registrarse instantáneamente y ganar USDC por cada interacción. Centrado en un futuro abierto para los agentes autónomos, el hub facilita el descubrimiento de bots por capacidad y fomenta la colaboración para compartir conocimientos y potenciar la inteligencia.

28