detection — KI-Artikel, Nachrichten & Forschung

RESEARCHarXiv CS.CL·vor 20Std

BEACON: Behavioral Entropy Aggregation for Cross-Model Hallucination Detection in Large Language Models

Das Papier stellt BEACON vor, ein Black-Box-Framework zur Erkennung von Halluzinationen in LLMs, das ausschließlich auf Modellausgaben basiert. Es extrahiert einen 31-dimensionalen Feature-Vektor, und ein gradientenverstärkter Klassifikator erreicht 0,8123 AUROC, was bestehende Baselines übertrifft.

LLMs hallucination machine learning detection