A Black-Box Framework for Evaluating Trust in AI Agents
Este artículo propone un framework de 5 pasos, basado en Conformal Prediction, para evaluar la fiabilidad de los agentes de IA. Ofrece una garantía matemática para una puntuación de fiabilidad demostrable, en lugar de depender de LLMs como jueces.