heapsort
RESEARCH27

Teaching Language Models to Forecast Research Success Through Comparative Idea Evaluation

arXiv CS.LG·23. Mai 2026

Dieser Artikel untersucht das Training von Sprachmodellen zur Vorhersage des empirischen Erfolgs von Forschungsideen durch vergleichende Ideenbewertung. SFT verbessert die Leistung erheblich über GPT-5 hinaus, und RLVR kann Modelle trainieren, interpretierbare Denkpfade für diese Vorhersageaufgabe zu entdecken.

Original lesen