← heapsort-ai

Medical Question Answering

2 items

RESEARCHarXiv CS.CL·vor 4T

Improving Heart-Focused Medical Question Answering in LLMs via Variance-Aware Rubric Rewards with GRPO

Diese Forschung untersucht die Verbesserung der herzfokussierten medizinischen Fragenbeantwortung in großen Sprachmodellen (LLMs) mithilfe der Gruppenrelativen Richtlinienoptimierung (GRPO) für das Nachtraining. Es wird ein Varianzbewusster Belohnungsrahmen vorgeschlagen, der die rubrikbasierte Überwachung mit kontinuierlichen analytischen Belohnungsfunktionen verbessert.

30
RESEARCHarXiv CS.CL·vor 5T

When Retrieval Doesn't Help: A Large-Scale Study of Biomedical RAG

Eine groß angelegte Studie evaluiert die Retrieval-Augmented Generation (RAG) im Bereich der medizinischen Fragenbeantwortung neu und findet nur geringe und inkonsistente Verbesserungen gegenüber Baselines ohne Retrieval. Sie deutet darauf hin, dass die Wahl des Backbone-Modells entscheidender ist als die Retrieval-Methoden und der Hauptengpass in der Fähigkeit des Modells liegt, abgerufene Evidenz effektiv zu nutzen.

28