RESEARCH27
Evaluating Reasoning Models for Queries with Presuppositions
arXiv CS.CL·6. Mai 2026
Diese Forschung untersucht, wie fortschrittliche Reasoning-Modelle mit Benutzeranfragen umgehen, die faktisch ungenaue Präsuppositionen enthalten. Obwohl diese Modelle eine leichte Verbesserung gegenüber Nicht-Reasoning-Modellen zeigen, versagen sie immer noch dabei, einen erheblichen Anteil falscher Annahmen zu hinterfragen.
Original lesen ↗