A Black-Box Framework for Evaluating Trust in AI Agents
Cet article propose un framework en 5 étapes, basé sur la prédiction conforme, pour évaluer la fiabilité des agents d'IA. Il offre une garantie mathématique pour un score de fiabilité prouvable, au lieu de s'appuyer sur des LLM comme juges.