heapsort
RESEARCH28

Your Agents Are Aging Too: Agent Lifespan Engineering for Deployed Systems

arXiv CS.AI·27 mai 2026

Les agents d'IA à longue durée de vie sont déployés comme systèmes opérationnels, mais leur évaluation ne tient pas compte de la fiabilité à long terme. Cet article introduit AgingBench, un benchmark de fiabilité longitudinale pour l'ingénierie de la durée de vie des agents, mesurant la dégradation et identifiant les cibles de réparation.

Lire l'original