← heapsort-ai

confidence estimation

2 items

RESEARCHarXiv CS.CL·20d atrás

Diagnosing Multi-step Reasoning Failures in Black-box LLMs via Stepwise Confidence Attribution

Este artigo apresenta o Stepwise Confidence Attribution (SCA), uma estrutura para LLMs de caixa preta que diagnostica falhas de raciocínio multi-etapa atribuindo confiança a cada passo. O SCA aplica o princípio do Information Bottleneck, identificando desvios de estruturas de consenso como potenciais erros, e propõe os métodos NIBS e GIBS.

27