RESEARCH27

Linear Probes Detect Task Format, Not Reasoning Mode in Language Model Hidden States

arXiv CS.CL·3 de junio de 2026

Este artículo revela que las sondas lineales, a menudo utilizadas para identificar representaciones de razonamiento distintas en estados ocultos de LLMs, en realidad detectan el formato de la tarea en lugar de los modos de razonamiento. La alta precisión observada en benchmarks con Qwen3-14B desapareció al controlar las variables de formato, sugiriendo un razonamiento en gran medida compartido no vinculado funcionalmente a la geometría del estado oculto.

Benchmarking Natural Language Processing Model Analysis AI Research LLM

Leer original ↗