notch
RESEARCH28

VERT: Reliable LLM Judges for Radiology Report Evaluation

arXiv CS.AI·7 de abril de 2026

O artigo propõe VERT, uma nova métrica baseada em LLM para avaliação de relatórios radiológicos. Ele compara VERT com métricas existentes em diversos modelos e datasets, analisando sua correlação com avaliações de especialistas para determinar as melhores configurações de LLM para juízes em radiologia.

Modelos de Linguagem GrandesIARadiologiaAvaliação de ModelosRelatórios MédicosLLMMétricas
Ler original