← heapsort-ai

Medical Question Answering

2 items

RESEARCHarXiv CS.CL·hace 4d

Improving Heart-Focused Medical Question Answering in LLMs via Variance-Aware Rubric Rewards with GRPO

Esta investigación explora la mejora de la respuesta a preguntas médicas centradas en el corazón en Modelos de Lenguaje Grandes (LLMs) utilizando la Optimización de Política Relativa de Grupo (GRPO) para el post-entrenamiento. Se propone un Marco de Recompensa Consciente de la Varianza que mejora la supervisión basada en rúbricas con funciones de recompensa analíticas continuas.

30
RESEARCHarXiv CS.CL·hace 5d

When Retrieval Doesn't Help: A Large-Scale Study of Biomedical RAG

Un estudio a gran escala reevalúa la Generación Aumentada por Recuperación (RAG) en la respuesta a preguntas médicas, encontrando solo mejoras pequeñas e inconsistentes en comparación con las líneas de base sin recuperación. Sugiere que la elección del modelo base es más crítica que los métodos de recuperación, y el principal cuello de botella es la capacidad del modelo para usar eficazmente la evidencia recuperada.

28