← heapsort-ai

OOD Detection

3 items

RESEARCHarXiv CS.LG·il y a 18j

Don't Collapse Your Features: Why CenterLoss Hurts OOD Detection and Multi-Scale Mahalanobis Wins

Cette recherche présente GOEN, un nouveau pipeline pour la détection des entrées hors distribution (OOD), combinant des caractéristiques multi-échelles et la distance de Mahalanobis. Elle révèle que CenterLoss dégrade de manière surprenante la performance de détection OOD, GOEN-NoCenterLoss obtenant des résultats de pointe.

29
RESEARCHarXiv CS.AI·il y a 18j

Benchmarking and Improving Monitors for Out-Of-Distribution Alignment Failure in LLMs

Cette recherche introduit MOOD, un benchmark conçu pour étudier la détection des échecs d'alignement hors distribution (OOD) dans les grands modèles de langage (LLMs) à l'aide de pipelines de surveillance. Elle propose de combiner des modèles de garde avec des détecteurs OOD pour améliorer la généralisation des classificateurs de sécurité, qui échouent souvent dans les scénarios OOD.

27