← heapsort-ai

Uncertainty Quantification

10 items

RESEARCHarXiv CS.LG·vor 1T

Are you sure? A Comprehensive and Comprehensible Survey of Uncertainty Quantification in Symbolic Regression

Die symbolische Regression (SR) erforscht mathematische Funktionen, um Beziehungen in Datensätzen zu erfassen, doch die mangelnde Unsicherheitsquantifizierung (UQ) begrenzt ihre Akzeptanz. Diese Umfrage ist die erste, die UQ in SR behandelt und die Literatur in frequentistische, Bayes'sche und Modellauswahlansätze gliedert.

60
RESEARCHarXiv CS.LG·4/17/2026

MixAtlas: Uncertainty-aware Data Mixture Optimization for Multimodal LLM Midtraining

MixAtlas führt eine unsicherheitsbewusste Methode zur Optimierung von Datenmischungen im Midtraining multimodaler LLMs ein, indem es Korpora entlang von Bildkonzepten und Aufgabenüberwachung zerlegt. Mithilfe von Proxy-Modellen und einem Gaußschen Prozess-Surrogat findet es leistungsfähigere Datenrezepte für verbesserte Stichprobenökonomie und Generalisierung.

32
RESEARCHarXiv CS.LG·vor 13T

Neural Bayesian Sequential Routing

Neural Bayesian Sequential Routing (NBSR) ist ein neues Framework, das neuronale Inferenz als aktive Evidenzakkumulation über einen hierarchischen gerichteten azyklischen Graphen modelliert. Es verwendet ein Dirichlet-Kategorial-Konjugat-Framework, um einen Dirichlet-Glaubenszustand zu aktualisieren, was pfadabhängiges Routing und Unsicherheitsquantifizierung ermöglicht.

29
RESEARCHarXiv CS.LG·vor 15T

Reading Calibrated Uncertainty from Language Model Trajectories

Diese Forschungsarbeit schlägt eine neue Methode zur Quantifizierung der Unsicherheit in Sprachmodellen vor, indem sie den kumulativen Pfad von MLP-Updates pro Schicht verfolgt. Durch die Extraktion von elf skaleninvarianten geometrischen Merkmalen übertrifft eine dünne lineare Sonde die maximale Softmax-Wahrscheinlichkeit bei der Bewertung der Unsicherheit.

28
RESEARCHarXiv CS.AI·4/16/2026

Quantifying and Understanding Uncertainty in Large Reasoning Models

Diese Forschung befasst sich mit der kritischen Herausforderung, die Unsicherheit in Großen Schlussfolgerungsmodellen (LRMs) zu quantifizieren, wobei die Einschränkungen traditioneller und bestehender Konformer Prädiktionsmethoden (CP) berücksichtigt werden. Ziel ist die Entwicklung eines statistisch rigorosen Ansatzes, der logische Verbindungen berücksichtigt, die Ursprünge der Unsicherheit interpretiert und die Qualität des Denkens von der Richtigkeit der Antwort entkoppelt.

27
RESEARCHarXiv CS.LG·4/15/2026

Uncertainty Quantification in CNN Through the Bootstrap of Convex Neural Networks

Dieses Paper schlägt ein neuartiges Bootstrap-basiertes Framework zur Unsicherheitsquantifizierung (UQ) in Convolutional Neural Networks (CNNs) vor, das den Mangel an theoretisch konsistenten UQ-Tools adressiert. Die Methode nutzt konvexifizierte neuronale Netze, um theoretische Konsistenz zu etablieren, bietet eine deutlich geringere Rechenlast und erforscht einen neuartigen Transfer-Learning-Ansatz.

27
RESEARCHarXiv CS.CL·vor 20T

Position: Uncertainty Quantification in LLMs is Just Unsupervised Clustering

Dieses Papier argumentiert, dass aktuelle Unsicherheitsquantifizierungs-(UQ)-Methoden für LLMs lediglich unüberwachte Clustering-Algorithmen sind, die die interne Konsistenz der Modellgenerierungen statt deren externe Korrektheit messen. Folglich können diese Methoden „zuversichtliche Halluzinationen“ nicht erkennen und bei der Bereitstellung von LLMs in kritischen Bereichen ein trügerisches Gefühl der Sicherheit erzeugen.

27
RESEARCHarXiv CS.AI·4/9/2026

SELFDOUBT: Uncertainty Quantification for Reasoning LLMs via the Hedge-to-Verify Ratio

Este artigo propõe SELFDOUBT, uma estrutura de passagem única para quantificar a incerteza em LLMs de raciocínio, especialmente para APIs proprietárias. Utiliza o Hedge-to-Verify Ratio (HVR) para identificar marcadores de incerteza e autoavaliação diretamente do rastro de raciocínio, superando métodos caros de amostragem.

27
RESEARCHarXiv CS.CL·4/7/2026

Evolutionary Search for Automated Design of Uncertainty Quantification Methods

Este artigo explora o uso de busca evolucionária impulsionada por LLMs para desenvolver automaticamente métodos de Quantificação de Incerteza (UQ) não supervisionados. Os métodos evoluídos superam baselines manuais em verificação de alegações, demonstrando generalização robusta e estratégias distintas entre diferentes modelos de LLM.

27