Ambiguity — artigos, notícias e pesquisas de IA

RESEARCHarXiv CS.CL·05/05/2026

CLEAR: Revealing How Noise and Ambiguity Degrade Reliability in LLMs for Medicine

O framework CLEAR é introduzido para avaliar como a ambiguidade e a incerteza afetam a confiabilidade dos Modelos de Linguagem Grandes (LLMs) médicos, indo além de benchmarks simplificados. Ele perturba sistematicamente as opções de resposta e seu enquadramento semântico, revelando que o aumento de respostas plausíveis degrada o desempenho dos LLMs e a cautela diminui com a formulação incerta da abstenção.

Ambiguity LLMs evaluation Reliability