uncertainty

6 items

RESEARCHarXiv CS.CL·vor 1T

How Language Models Fail: Token-Level Signatures of Committed and Persistent Reasoning Failures

Fehler im Sprachmodell-Denken entstehen durch unterschiedliche Prozesse, die identifizierbare Token-Level-Signaturen hinterlassen. Diese Fehler werden als „festgelegter Fehler“ oder „anhaltende Unsicherheit“ charakterisiert, und das Verständnis dieser Signaturen hilft, fehlerhafte von erfolgreichen Vervollständigungen in verschiedenen Konfigurationen zu unterscheiden.

language models research Reasoning AI failures

RESEARCHarXiv CS.AI·vor 19T

$ECUAS_n$: A family of metrics for principled evaluation of uncertainty-augmented systems

Diese Forschung schlägt eine neue Metrikfamilie, $ECUAS_n$, zur Bewertung von unsicherheitserweiterten (UA) Systemen in der automatisierten Entscheidungsfindung vor. Es wird argumentiert, dass bestehende Bewertungsansätze unzureichend sind, um die Gesamtleistung von UA-Systemen zu beurteilen, bei denen die prädiktive Unsicherheit für fundierte Benutzerentscheidungen entscheidend ist.

Decision Making predictive uncertainty Metrics uncertainty

DOCDEV.to AI·vor 23T

How Probabilistic Reasoning Works — From Evidence to Better Beliefs

Probabilistisches Denken ermöglicht es KI, Entscheidungen unter Unsicherheit zu treffen, indem es Wahrscheinlichkeiten zuweist und mit neuen Beweisen aktualisiert. Der Satz von Bayes ist zentral für diesen Prozess, der vom anfänglichen Glauben zur aktualisierten Entscheidung führt.

Decision Making AI Systems Bayes' theorem Probabilistic reasoning

RESEARCHarXiv CS.CL·vor 25T

When Evidence Conflicts: Uncertainty and Order Effects in Retrieval-Augmented Biomedical Question Answering

Diese Forschung bewertet große Sprachmodelle (LLMs) bei der Beantwortung biomedizinischer Fragen, wobei deren Zuverlässigkeit bei widersprüchlichen oder unvollständigen Beweisen thematisiert wird. Es zeigt sich, dass die Genauigkeit von LLMs erheblich sinkt und Vorhersagen sich ändern, wenn die Reihenfolge korrekter und widersprüchlicher Dokumente vertauscht wird, was Probleme mit Reihenfolgeeffekten und die Notwendigkeit einer konfliktbewussten Enthaltung hervorhebt.

LLMs evaluation Reliability Biomedical AI

RESEARCHarXiv CS.AI·vor 8T

Uncertainty-Aware and Temporally Regulated Expert Advice in Reinforcement Learning for Autonomous Driving

Dieses Papier schlägt ein unsicherheitsbewusstes Framework für Reinforcement Learning im autonomen Fahren vor, das Expertenratschläge zur sicheren Steuerung der Exploration nutzt und langfristige Abhängigkeiten vermeidet. Es verwendet adaptive Schwellenwerte für die Ratgeberauslösung und eine Commitment-Cooldown-Strategie zur Regulierung der Anleitung, wodurch eine verbesserte Leistung in CARLA-Simulationen gezeigt wird.

reinforcement learning autonomous driving Exploration uncertainty

ARTICLEDEV.to AI·4/9/2026

Everhayes Academy (Everhayes Omnis Academy): Trading Is Not About Prediction

A Everhayes Academy propõe que o trading de sucesso a longo prazo não se baseia na previsão de mercado, mas na construção de uma estrutura de decisão consistente sob incerteza. Esta abordagem contrasta com a intuição humana de buscar previsões determinísticas, marcando a diferença entre trading experiencial e baseado em sistemas.

market analysis Investing Decision Making trading