heapsort
RESEARCH27

Evaluating Reasoning Models for Queries with Presuppositions

arXiv CS.CL·6 de maio de 2026

Esta pesquisa avalia como modelos de raciocínio avançados lidam com perguntas de usuários que contêm pressuposições factualmente imprecisas. Embora esses modelos mostrem uma leve melhora em relação aos modelos não-racionais, eles ainda falham em questionar uma fração significativa de premissas falsas.

Ler original