uncertainty

6 items

RESEARCHarXiv CS.CL·1d ago

How Language Models Fail: Token-Level Signatures of Committed and Persistent Reasoning Failures

Failures in language model reasoning emerge through distinct processes that leave identifiable token-level signatures. These failures are characterized as "committed failure" or "persistent uncertainty", and understanding these signatures helps distinguish failing from successful completions across various configurations.

language models research Reasoning AI failures

RESEARCHarXiv CS.AI·19d ago

$ECUAS_n$: A family of metrics for principled evaluation of uncertainty-augmented systems

This research proposes a new family of metrics, $ECUAS_n$, for evaluating uncertainty-augmented (UA) systems in automated decision-making. It argues that existing evaluation approaches are insufficient for assessing overall performance of UA systems, where predictive uncertainty is crucial for users to make informed decisions.

Decision Making predictive uncertainty Metrics uncertainty

DOCDEV.to AI·23d ago

How Probabilistic Reasoning Works — From Evidence to Better Beliefs

Probabilistic reasoning allows AI to make decisions under uncertainty by assigning and updating probabilities with new evidence. Bayes' theorem is central to this process, which moves from prior belief to updated decision.

Decision Making AI Systems Bayes' theorem Probabilistic reasoning

RESEARCHarXiv CS.CL·25d ago

When Evidence Conflicts: Uncertainty and Order Effects in Retrieval-Augmented Biomedical Question Answering

This research evaluates large language models (LLMs) in biomedical question answering, specifically addressing their reliability when faced with conflicting or incomplete evidence. It reveals that LLM accuracy significantly drops, and predictions flip, when the order of correct and contradictory documents is reversed, highlighting issues with order effects and the need for conflict-aware abstention.

LLMs evaluation Reliability Biomedical AI

RESEARCHarXiv CS.AI·8d ago

Uncertainty-Aware and Temporally Regulated Expert Advice in Reinforcement Learning for Autonomous Driving

This paper proposes an uncertainty-aware framework for reinforcement learning in autonomous driving, leveraging expert advice to guide exploration safely while avoiding long-term dependence. It employs adaptive thresholds for advice triggering and a commitment-cooldown strategy to regulate guidance, demonstrating improved performance in CARLA simulations.

reinforcement learning autonomous driving Exploration uncertainty

ARTICLEDEV.to AI·4/9/2026

Everhayes Academy (Everhayes Omnis Academy): Trading Is Not About Prediction

A Everhayes Academy propõe que o trading de sucesso a longo prazo não se baseia na previsão de mercado, mas na construção de uma estrutura de decisão consistente sob incerteza. Esta abordagem contrasta com a intuição humana de buscar previsões determinísticas, marcando a diferença entre trading experiencial e baseado em sistemas.

market analysis Investing Decision Making trading