RESEARCH28

Long-Context Reasoning Through Proxy-Based Chain-of-Thought Tuning

arXiv CS.CL·21 de maio de 2026

Modelos de linguagem grandes enfrentam dificuldades em tarefas de raciocínio de contexto longo, apesar de suportarem muitas entradas. ProxyCoT é uma nova estrutura de treinamento que transfere as capacidades de raciocínio de contextos proxy curtos para contextos longos completos, superando as linhas de base existentes.

machine learning Natural Language Processing Reasoning large language models AI Research

Ler original ↗