Model Monitoring

2 items

RESEARCHarXiv CS.AI·il y a 18j

Benchmarking and Improving Monitors for Out-Of-Distribution Alignment Failure in LLMs

Cette recherche introduit MOOD, un benchmark conçu pour étudier la détection des échecs d'alignement hors distribution (OOD) dans les grands modèles de langage (LLMs) à l'aide de pipelines de surveillance. Elle propose de combiner des modèles de garde avec des détecteurs OOD pour améliorer la généralisation des classificateurs de sécurité, qui échouent souvent dans les scénarios OOD.

Model Monitoring OOD Detection LLMs benchmarking

ARTICLEWeights & Biases·08/11/2019

Tracking the heartbeat of ML models by exploring gradients

Ce contenu explore des méthodes pour surveiller le comportement des modèles d'apprentissage automatique en analysant les gradients. Il détaille comment suivre le "battement de cœur" de ces modèles pour garantir leurs performances et leur stabilité.

Model Monitoring machine learning Gradients AI development