RESEARCHarXiv CS.CL·05/05/2026
CLEAR: Revealing How Noise and Ambiguity Degrade Reliability in LLMs for Medicine
O framework CLEAR é introduzido para avaliar como a ambiguidade e a incerteza afetam a confiabilidade dos Modelos de Linguagem Grandes (LLMs) médicos, indo além de benchmarks simplificados. Ele perturba sistematicamente as opções de resposta e seu enquadramento semântico, revelando que o aumento de respostas plausíveis degrada o desempenho dos LLMs e a cautela diminui com a formulação incerta da abstenção.
27