Conformal Prediction

4 items

RESEARCHarXiv CS.AI·23/4/2026

From Actions to Understanding: Conformal Interpretability of Temporal Concepts in LLM Agents

Este artículo introduce un marco de interpretabilidad conformal para agentes LLM, con el fin de comprender la evolución temporal de conceptos. Combina el modelado de recompensas paso a paso y la predicción conformal para etiquetar representaciones internas e identificar direcciones latentes de éxito, fracaso o deriva del razonamiento.

LLM Agents AI interpretability Conformal Prediction

ARTICLEDEV.to AI·12/4/2026

A Black-Box Framework for Evaluating Trust in AI Agents

Este artículo propone un framework de 5 pasos, basado en Conformal Prediction, para evaluar la fiabilidad de los agentes de IA. Ofrece una garantía matemática para una puntuación de fiabilidad demostrable, en lugar de depender de LLMs como jueces.

framework AI reliability LLM Trust Conformal Prediction

RESEARCHarXiv CS.AI·16/4/2026

Quantifying and Understanding Uncertainty in Large Reasoning Models

Esta investigación aborda el desafío crítico de cuantificar la incertidumbre en Grandes Modelos de Razonamiento (LRMs), señalando las limitaciones de los métodos tradicionales y existentes de Predicción Conformal (CP). Su objetivo es desarrollar un enfoque estadísticamente riguroso que considere las conexiones lógicas, interprete los orígenes de la incertidumbre y desvincule la calidad del razonamiento de la corrección de la respuesta.

AI models reasoning AI Uncertainty Quantification Conformal Prediction

RESEARCHarXiv CS.LG·28/4/2026

Conformal PM2.5 Mapping Under Spatial Covariate Shift: Satellite-Reanalysis Fusion for Africa's Green Industrial Transition

Este artículo presenta un sistema de fusión satélite-reanálisis para el mapeo de PM2.5 en África, utilizando LightGBM y predicción conformada para el monitoreo de la calidad del aire. El sistema aborda los desafíos de la generalización geográfica y la cuantificación de la incertidumbre para la transición industrial verde del continente.

Geospatial AI environmental AI machine learning Air Quality