RESEARCH27

Linear Probes Detect Task Format, Not Reasoning Mode in Language Model Hidden States

arXiv CS.CL·3 de junho de 2026

Este artigo revela que as sondas lineares, frequentemente usadas para identificar representações de raciocínio distintas em estados ocultos de LLMs, na verdade detectam o formato da tarefa em vez dos modos de raciocínio. A alta precisão observada em benchmarks com o Qwen3-14B desaparece ao controlar as variáveis de formato, sugerindo que o raciocínio é amplamente compartilhado e não funcionalmente ligado à geometria dos estados ocultos.

benchmarking Natural Language Processing Model Analysis AI research LLM

Ler original ↗