← heapsort-ai

OOD Detection

3 items

RESEARCHarXiv CS.LG·vor 18T

Don't Collapse Your Features: Why CenterLoss Hurts OOD Detection and Multi-Scale Mahalanobis Wins

Diese Forschung stellt GOEN vor, eine neue Pipeline zur Erkennung von Out-of-Distribution (OOD)-Eingaben, die mehrskalige Merkmale und den Mahalanobis-Abstand kombiniert. Sie zeigt, dass CenterLoss die OOD-Erkennungsleistung überraschenderweise verschlechtert, wobei GOEN-NoCenterLoss hervorragende Ergebnisse erzielt.

29
RESEARCHarXiv CS.AI·vor 18T

Benchmarking and Improving Monitors for Out-Of-Distribution Alignment Failure in LLMs

Diese Forschung stellt MOOD vor, einen Benchmark zur Untersuchung der Erkennung von Out-Of-Distribution (OOD)-Ausrichtungsfehlern in großen Sprachmodellen (LLMs) mithilfe von Überwachungspipelines. Es wird vorgeschlagen, Schutzmodelle mit OOD-Detektoren zu kombinieren, um die Generalisierung von Sicherheitsklassifikatoren zu verbessern, die in OOD-Szenarien oft versagen.

27