detection — artículos, noticias e investigación de IA

RESEARCHarXiv CS.CL·hace 20h

BEACON: Behavioral Entropy Aggregation for Cross-Model Hallucination Detection in Large Language Models

El documento introduce BEACON, un marco de caja negra para detectar alucinaciones en LLMs, operando solo con las salidas del modelo sin acceso interno. Extrae un vector de características de 31 dimensiones, y un clasificador logra 0,8123 AUROC, superando las bases de referencia.

LLMs hallucination machine learning detection