heapsort
RESEARCH28

Long-Context Reasoning Through Proxy-Based Chain-of-Thought Tuning

arXiv CS.CL·21 de mayo de 2026

Los grandes modelos de lenguaje tienen un rendimiento deficiente en tareas de razonamiento de contexto largo a pesar de admitir entradas extensas. ProxyCoT propone una nueva estructura de entrenamiento que transfiere las capacidades de razonamiento de contextos proxy cortos a contextos largos completos, superando a los modelos base.

Leer original