RESEARCHarXiv CS.CL·hace 20h
BEACON: Behavioral Entropy Aggregation for Cross-Model Hallucination Detection in Large Language Models
El documento introduce BEACON, un marco de caja negra para detectar alucinaciones en LLMs, operando solo con las salidas del modelo sin acceso interno. Extrae un vector de características de 31 dimensiones, y un clasificador logra 0,8123 AUROC, superando las bases de referencia.
54