← heapsort-ai

Scientific Reasoning

2 items

RESEARCHarXiv CS.LG·20d atrás

ReCrit: Transition-Aware Reinforcement Learning for Scientific Critic Reasoning

ReCrit é um novo framework de aprendizagem por reforço projetado para melhorar o desempenho de modelos de linguagem grandes na interação crítica científica. Ele aborda a questão de LLMs abandonarem soluções corretas após a crítica do usuário, focando em transições de correção entre turnos e categorizando comportamentos como correção, bajulação e robustez.

29
RESEARCHarXiv CS.AI·13/04/2026

Hidden in Plain Sight: Visual-to-Symbolic Analytical Solution Inference from Field Visualizations

Esta pesquisa introduz a Inferência de Soluções Analíticas Visual-para-Simbólica (ViSA), uma capacidade de IA para recuperar soluções analíticas de campos físicos a partir de observações visuais. O estudo apresenta ViSA-R2, um pipeline auto-verificável que simula o raciocínio de um físico, e ViSA-Bench, um novo benchmark para avaliar modelos neste domínio.

27