RESEARCH28
VERT: Reliable LLM Judges for Radiology Report Evaluation
arXiv CS.AI·7 de abril de 2026
O artigo propõe VERT, uma nova métrica baseada em LLM para avaliação de relatórios radiológicos. Ele compara VERT com métricas existentes em diversos modelos e datasets, analisando sua correlação com avaliações de especialistas para determinar as melhores configurações de LLM para juízes em radiologia.
Modelos de Linguagem GrandesIARadiologiaAvaliação de ModelosRelatórios MédicosLLMMétricas
Ler original ↗