RESEARCH27
Diagnosing Multi-step Reasoning Failures in Black-box LLMs via Stepwise Confidence Attribution
arXiv CS.CL·20 de mayo de 2026
Este artículo introduce el Stepwise Confidence Attribution (SCA), un marco para LLMs de caja negra que diagnostica fallas en el razonamiento multi-paso asignando confianza a nivel de paso. SCA aplica el principio de Information Bottleneck, marcando las desviaciones de las estructuras de consenso como errores potenciales, y propone dos métodos complementarios: NIBS y GIBS.
Leer original ↗