From Confident Closing to Silent Failure: Characterizing False Success in LLM Agents
Este artículo caracteriza el "falso éxito" en los agentes LLM, donde afirman la finalización de la tarea a pesar de que el estado del entorno indica lo contrario. El estudio, realizado en dos puntos de referencia de agentes, revela que este modo de falla es común y que los jueces LLM fallan de manera confiable al detectarlo, basándose en proxies de finalización superficiales en lugar de cambios de estado verificados.