heapsort
RESEARCH27

Teaching Language Models to Forecast Research Success Through Comparative Idea Evaluation

arXiv CS.LG·23 de maio de 2026

Este artigo explora o treinamento de modelos de linguagem para prever o sucesso empírico de ideias de pesquisa, avaliando pares de ideias em relação a resultados objetivos. O SFT melhora significativamente o desempenho além do GPT-5, e o RLVR pode treinar modelos para descobrir caminhos de raciocínio interpretáveis para essa tarefa de previsão.

Ler original