← heapsort-ai

Medical Question Answering

2 items

RESEARCHarXiv CS.CL·il y a 4j

Improving Heart-Focused Medical Question Answering in LLMs via Variance-Aware Rubric Rewards with GRPO

Cette recherche étudie l'amélioration de la réponse aux questions médicales axées sur le cœur dans les grands modèles linguistiques (LLM) à l'aide de l'optimisation de la politique relative de groupe (GRPO) pour le post-apprentissage. Un cadre de récompense sensible à la variance est proposé pour améliorer la supervision basée sur des rubriques avec des fonctions de récompense analytiques continues.

30
RESEARCHarXiv CS.CL·il y a 5j

When Retrieval Doesn't Help: A Large-Scale Study of Biomedical RAG

Une étude à grande échelle réévalue la Génération Augmentée par Récupération (RAG) dans la réponse aux questions médicales, ne trouvant que des améliorations faibles et inconsistantes par rapport aux bases de référence sans récupération. Elle suggère que le choix du modèle de base est plus critique que les méthodes de récupération, et le principal goulot d'étranglement est la capacité du modèle à utiliser efficacement les preuves récupérées.

28