← heapsort-ai

OOD Detection

3 items

RESEARCHarXiv CS.LG·17d atrás

Don't Collapse Your Features: Why CenterLoss Hurts OOD Detection and Multi-Scale Mahalanobis Wins

Esta pesquisa apresenta GOEN, uma nova abordagem para detecção de entradas fora da distribuição (OOD), que combina características multi-escala e distância de Mahalanobis. O estudo revela que o CenterLoss, apesar de melhorar a precisão da classificação, degrada o desempenho da detecção OOD, com o GOEN-NoCenterLoss alcançando resultados superiores.

29
RESEARCHarXiv CS.AI·17d atrás

Benchmarking and Improving Monitors for Out-Of-Distribution Alignment Failure in LLMs

Esta pesquisa apresenta MOOD, um benchmark projetado para estudar a detecção de falhas de alinhamento fora da distribuição (OOD) em grandes modelos de linguagem (LLMs) usando pipelines de monitoramento. Propõe-se combinar modelos de guarda com detectores OOD para melhorar a generalização de classificadores de segurança, que frequentemente falham em cenários OOD.

27