A Black-Box Framework for Evaluating Trust in AI Agents
Este artigo propõe um framework de 5 passos, baseado em Conformal Prediction, para avaliar a confiabilidade de agentes de IA, oferecendo uma garantia matemática em vez de depender de LLMs como juízes. O objetivo é fornecer uma pontuação de confiabilidade comprovável para agentes LLM.