RESEARCH28

Long-Context Reasoning Through Proxy-Based Chain-of-Thought Tuning

arXiv CS.CL·21. Mai 2026

Große Sprachmodelle zeigen trotz Unterstützung umfangreicher Eingaben schlechte Leistungen bei komplexen Langkontext-Argumentationsaufgaben. ProxyCoT ist ein neuer Trainingsansatz, der Argumentationsfähigkeiten von kurzen Proxy-Kontexten auf vollständige lange Kontexte überträgt und starke Baselines übertrifft.

machine learning Natural Language Processing Reasoning large language models AI Research

Original lesen ↗