RESEARCH27
Linear Probes Detect Task Format, Not Reasoning Mode in Language Model Hidden States
arXiv CS.CL·3 de junio de 2026
Este artículo revela que las sondas lineales, a menudo utilizadas para identificar representaciones de razonamiento distintas en estados ocultos de LLMs, en realidad detectan el formato de la tarea en lugar de los modos de razonamiento. La alta precisión observada en benchmarks con Qwen3-14B desapareció al controlar las variables de formato, sugiriendo un razonamiento en gran medida compartido no vinculado funcionalmente a la geometría del estado oculto.
Leer original ↗