← heapsort-ai

OOD Detection

3 items

RESEARCHarXiv CS.LG·hace 17d

Don't Collapse Your Features: Why CenterLoss Hurts OOD Detection and Multi-Scale Mahalanobis Wins

Esta investigación introduce GOEN, un nuevo método para la detección de entradas fuera de distribución (OOD), que combina características multiescala y la distancia de Mahalanobis. El estudio revela que CenterLoss, a pesar de mejorar la precisión de clasificación, degrada el rendimiento de la detección OOD, con GOEN-NoCenterLoss logrando resultados superiores.

29
RESEARCHarXiv CS.AI·hace 17d

Benchmarking and Improving Monitors for Out-Of-Distribution Alignment Failure in LLMs

Esta investigación introduce MOOD, un benchmark diseñado para estudiar la detección de fallos de alineación fuera de distribución (OOD) en grandes modelos de lenguaje (LLMs) mediante pipelines de monitoreo. Propone combinar modelos de guardia con detectores OOD para mejorar la generalización de los clasificadores de seguridad, que a menudo fallan en escenarios OOD.

27