RESEARCH54

BEACON: Behavioral Entropy Aggregation for Cross-Model Hallucination Detection in Large Language Models

arXiv CS.CL·9 de junio de 2026

El documento introduce BEACON, un marco de caja negra para detectar alucinaciones en LLMs, operando solo con las salidas del modelo sin acceso interno. Extrae un vector de características de 31 dimensiones, y un clasificador logra 0,8123 AUROC, superando las bases de referencia.

LLMs hallucination machine learning detection AI safety

Leer original ↗