← heapsort-ai

Scientific Reasoning

2 items

RESEARCHarXiv CS.LG·vor 20T

ReCrit: Transition-Aware Reinforcement Learning for Scientific Critic Reasoning

ReCrit ist ein neues Reinforcement-Learning-Framework, das entwickelt wurde, um die Leistung großer Sprachmodelle bei der wissenschaftlichen Kritikerinteraktion zu verbessern. Es befasst sich mit dem Problem, dass LLMs nach Benutzerkritik korrekte Lösungen aufgeben, indem es sich auf korrekte Übergänge zwischen den Runden konzentriert und Verhaltensweisen wie Korrektur, Sycophanie und Robustheit kategorisiert.

29
RESEARCHarXiv CS.AI·4/13/2026

Hidden in Plain Sight: Visual-to-Symbolic Analytical Solution Inference from Field Visualizations

Diese Forschung stellt Visual-to-Symbolic Analytical Solution Inference (ViSA) vor, eine KI-Fähigkeit zur Wiederherstellung analytischer Lösungen physikalischer Felder aus visuellen Beobachtungen. Sie präsentiert ViSA-R2, eine selbstverifizierende Pipeline, die das Denken eines Physikers nachahmt, und ViSA-Bench, einen neuen Benchmark zur Bewertung von Modellen in diesem Bereich.

27