heapsort
RESEARCH28

Your Agents Are Aging Too: Agent Lifespan Engineering for Deployed Systems

arXiv CS.AI·27. Mai 2026

Langzeit-KI-Agenten werden als persistente Betriebssysteme eingesetzt, ihre Bewertung berücksichtigt jedoch nicht die Zuverlässigkeit über die Zeit. Diese Arbeit stellt AgingBench vor, einen longitudinalen Zuverlässigkeits-Benchmark für das Agenten-Lebensdauer-Engineering, der den Abbau misst und Reparaturziele identifiziert.

Original lesen