RESEARCH28
Long-Context Reasoning Through Proxy-Based Chain-of-Thought Tuning
arXiv CS.CL·21 mai 2026
Malgré la prise en charge d'entrées étendues, les grands modèles linguistiques ont des performances médiocres sur les tâches de raisonnement à contexte long. ProxyCoT est un nouveau cadre d'entraînement qui transfère les capacités de raisonnement des contextes proxy courts aux contextes longs complets, surpassant les références solides.
Lire l'original ↗