← heapsort-ai

Calibration

6 items

ARTICLEDEV.to AI·il y a 5j

Calibration set size for LLM-as-judge: when 50 traces is enough and when 200 is mandatory

La taille de l'ensemble de calibration étiqueté par des humains pour valider un LLM-as-judge dépend de l'équilibre des étiquettes. Cinquante traces sont suffisantes pour des critères binaires équilibrés, mais 200 ou plus sont nécessaires pour des catégories rares et coûteuses, comme les violations de sécurité, car la variance du kappa est dominée par les exemples de la classe minoritaire.

28
DOCDEV.to AI·il y a 21j

Nvidia Ising Quantum AI: Calibration Models Guide 2026

Ce guide traite les modèles d'IA quantique Ising open-source de Nvidia comme des services de production, en se concentrant sur leur déploiement, leur orchestration, leurs garde-fous et leur gouvernance au sein des cadres de sécurité IA existants. Il souligne l'importance critique de la calibration pour la performance réelle des solveurs Ising d'inspiration quantique, car des systèmes mal réglés peuvent entraîner des défaillances de production significatives.

28
RESEARCHarXiv CS.CL·il y a 27j

Sampling More, Getting Less: Calibration is the Diversity Bottleneck in LLMs

Cette recherche examine le manque de diversité dans les sorties des LLM, l'attribuant à la manière dont les modèles allouent la masse de probabilité entre les continuations valides et invalides lors du décodage. Elle introduit un cadre validité-diversité qui décompose le problème en deux formes complémentaires de défaut de calibration : la calibration d'ordre et la calibration de forme.

27