← heapsort-ai

Calibration

6 items

ARTICLEKDNuggets·vor 4T

A Deep Dive into Calibration of Language Models: Platt Scaling, Isotonic Regression, Temperature Scaling

Dieser Inhalt untersucht drei Post-hoc-Methoden – Platt Scaling, Isotonic Regression und Temperature Scaling –, die darauf abzielen, die Kalibrierung von Sprachmodellen zu verbessern. Diese Techniken sollen die Diskrepanz zwischen der vorhergesagten Konfidenz eines Modells und seiner tatsächlichen Genauigkeit verringern.

A Deep Dive into Calibration of Language Models: Platt Scaling, Isotonic Regression, Temperature Scaling
34
ARTICLEDEV.to AI·vor 5T

Calibration set size for LLM-as-judge: when 50 traces is enough and when 200 is mandatory

Die Größe des von Menschen etikettierten Kalibrierungssatzes zur Validierung eines LLM-as-judge hängt von der Ausgewogenheit der Labels ab. Fünfzig stratifizierte Spuren reichen für ausgewogene binäre Kriterien aus, aber für seltene, aber kostspielige Kategorien wie Sicherheitsverletzungen sind 200 oder mehr obligatorisch, da die Varianz des Kappa durch die Anzahl der Minderheitsklasse-Beispiele dominiert wird.

28
DOCDEV.to AI·vor 21T

Nvidia Ising Quantum AI: Calibration Models Guide 2026

Dieser Leitfaden behandelt Nvidias Open-Source-Ising-Quanten-KI-Modelle als Produktions-KI-Dienste, wobei der Schwerpunkt auf deren Bereitstellung, Orchestrierung, Schutzmechanismen und Governance im Rahmen bestehender KI-Sicherheitsframeworks liegt. Er betont die entscheidende Bedeutung der Kalibrierung für die reale Leistung von quanteninspirierten Ising-Solvern, da falsch abgestimmte Systeme zu erheblichen Produktionsfehlern führen können.

28
RESEARCHarXiv CS.CL·vor 27T

Sampling More, Getting Less: Calibration is the Diversity Bottleneck in LLMs

Diese Forschung befasst sich mit dem Mangel an Diversität in den Ausgaben von LLMs und führt ihn darauf zurück, wie Modelle während der Dekodierung Wahrscheinlichkeitsmasse über gültige und ungültige Fortsetzungen verteilen. Sie stellt ein Validitäts-Diversitäts-Framework vor, das das Problem in zwei komplementäre Formen der Fehlkalibrierung zerlegt: Ordnungskalibrierung und Formkalibrierung.

27