RESEARCHarXiv CS.LG·vor 18T
Teaching Language Models to Forecast Research Success Through Comparative Idea Evaluation
Dieser Artikel untersucht das Training von Sprachmodellen zur Vorhersage des empirischen Erfolgs von Forschungsideen durch vergleichende Ideenbewertung. SFT verbessert die Leistung erheblich über GPT-5 hinaus, und RLVR kann Modelle trainieren, interpretierbare Denkpfade für diese Vorhersageaufgabe zu entdecken.
27