RESEARCH27
Linear Probes Detect Task Format, Not Reasoning Mode in Language Model Hidden States
arXiv CS.CL·3 de junho de 2026
Este artigo revela que as sondas lineares, frequentemente usadas para identificar representações de raciocínio distintas em estados ocultos de LLMs, na verdade detectam o formato da tarefa em vez dos modos de raciocínio. A alta precisão observada em benchmarks com o Qwen3-14B desaparece ao controlar as variáveis de formato, sugerindo que o raciocínio é amplamente compartilhado e não funcionalmente ligado à geometria dos estados ocultos.
Ler original ↗