← heapsort-ai

Scientific Reasoning

2 items

RESEARCHarXiv CS.LG·hace 21d

ReCrit: Transition-Aware Reinforcement Learning for Scientific Critic Reasoning

ReCrit es un nuevo marco de aprendizaje por refuerzo diseñado para mejorar el rendimiento de los grandes modelos de lenguaje en la interacción crítica científica. Aborda el problema de que los LLM abandonen soluciones correctas después de la crítica del usuario, centrándose en las transiciones de corrección entre turnos y categorizando comportamientos como la corrección, la adulación y la robustez.

29
RESEARCHarXiv CS.AI·13/4/2026

Hidden in Plain Sight: Visual-to-Symbolic Analytical Solution Inference from Field Visualizations

Esta investigación introduce la Inferencia de Soluciones Analíticas Visual-a-Simbólica (ViSA), una capacidad de IA para recuperar soluciones analíticas de campos físicos a partir de observaciones visuales. Presenta ViSA-R2, una cadena de pensamiento auto-verificable que emula el razonamiento de un físico, y ViSA-Bench, un nuevo benchmark para evaluar modelos en este ámbito.

27