← heapsort-ai

Calibration

6 items

ARTICLEDEV.to AI·hace 5d

Calibration set size for LLM-as-judge: when 50 traces is enough and when 200 is mandatory

El tamaño del conjunto de calibración etiquetado por humanos para validar un LLM-as-judge depende del equilibrio de las etiquetas. Cincuenta rastros son suficientes para criterios binarios equilibrados, pero se requieren 200 o más para categorías raras pero costosas, como las violaciones de seguridad, ya que la varianza de kappa está dominada por los ejemplos de la clase minoritaria.

28
DOCDEV.to AI·hace 21d

Nvidia Ising Quantum AI: Calibration Models Guide 2026

Esta guía trata los modelos de IA cuántica Ising de código abierto de Nvidia como servicios de producción, centrándose en su implementación, orquestación, salvaguardias y gobernanza dentro de los marcos de seguridad de IA existentes. Destaca la importancia crítica de la calibración para el rendimiento real de los solucionadores Ising inspirados en la cuántica, ya que los sistemas mal ajustados pueden provocar fallos de producción significativos.

28
RESEARCHarXiv CS.CL·hace 27d

Sampling More, Getting Less: Calibration is the Diversity Bottleneck in LLMs

Este estudio aborda la falta de diversidad en las salidas de los LLM, atribuyéndola a cómo los modelos asignan la masa de probabilidad entre continuaciones válidas e inválidas durante la decodificación. Introduce un marco de validez-diversidad que descompone el problema en dos formas complementarias de descalibración: calibración de orden y calibración de forma.

27