RESEARCHarXiv CS.CL·06/05/2026
Evaluating Reasoning Models for Queries with Presuppositions
Esta pesquisa avalia como modelos de raciocínio avançados lidam com perguntas de usuários que contêm pressuposições factualmente imprecisas. Embora esses modelos mostrem uma leve melhora em relação aos modelos não-racionais, eles ainda falham em questionar uma fração significativa de premissas falsas.
27