RESEARCH28

Long-Context Reasoning Through Proxy-Based Chain-of-Thought Tuning

arXiv CS.CL·21 mai 2026

Malgré la prise en charge d'entrées étendues, les grands modèles linguistiques ont des performances médiocres sur les tâches de raisonnement à contexte long. ProxyCoT est un nouveau cadre d'entraînement qui transfère les capacités de raisonnement des contextes proxy courts aux contextes longs complets, surpassant les références solides.

machine learning Natural Language Processing Reasoning large language models AI Research

Lire l'original ↗