RESEARCH27
Teaching Language Models to Forecast Research Success Through Comparative Idea Evaluation
arXiv CS.LG·23. Mai 2026
Dieser Artikel untersucht das Training von Sprachmodellen zur Vorhersage des empirischen Erfolgs von Forschungsideen durch vergleichende Ideenbewertung. SFT verbessert die Leistung erheblich über GPT-5 hinaus, und RLVR kann Modelle trainieren, interpretierbare Denkpfade für diese Vorhersageaufgabe zu entdecken.
Original lesen ↗