RESEARCHarXiv CS.AI·vor 13T
Your Agents Are Aging Too: Agent Lifespan Engineering for Deployed Systems
Langzeit-KI-Agenten werden als persistente Betriebssysteme eingesetzt, ihre Bewertung berücksichtigt jedoch nicht die Zuverlässigkeit über die Zeit. Diese Arbeit stellt AgingBench vor, einen longitudinalen Zuverlässigkeits-Benchmark für das Agenten-Lebensdauer-Engineering, der den Abbau misst und Reparaturziele identifiziert.
28