← heapsort-ai

Scientific Reasoning

2 items

RESEARCHarXiv CS.LG·il y a 20j

ReCrit: Transition-Aware Reinforcement Learning for Scientific Critic Reasoning

ReCrit est un nouveau cadre d'apprentissage par renforcement conçu pour améliorer la performance des grands modèles linguistiques dans l'interaction critique scientifique. Il aborde le problème des LLM qui abandonnent des solutions correctes après une critique de l'utilisateur, en se concentrant sur les transitions de correction entre les tours et en catégorisant les comportements tels que la correction, la sycophanie et la robustesse.

29
RESEARCHarXiv CS.AI·13/04/2026

Hidden in Plain Sight: Visual-to-Symbolic Analytical Solution Inference from Field Visualizations

Cette recherche introduit l'inférence de solutions analytiques visuelles-à-symboliques (ViSA), une capacité d'IA pour récupérer des solutions analytiques de champs physiques à partir d'observations visuelles. Elle présente ViSA-R2, un pipeline auto-vérifiant imitant le raisonnement d'un physicien, et ViSA-Bench, un nouveau benchmark pour évaluer les modèles dans ce domaine.

27