heapsort
RESEARCH28

When Cases Get Rare: A Retrieval Benchmark for Off-Guideline Clinical Question Answering

arXiv CS.CL·22 de mayo de 2026

Este artículo presenta OGCaReBench, un nuevo benchmark centrado en la recuperación para evaluar la capacidad de los LLMs de responder a preguntas clínicas que van más allá de las pautas médicas típicas. Aborda la brecha de que la mayoría de los LLMs médicos están entrenados en conocimientos comunes y centrados en pautas, mientras que la práctica real a menudo implica casos raros no cubiertos por estas.

Leer original