RESEARCHarXiv CS.LG·18d atrás
Teaching Language Models to Forecast Research Success Through Comparative Idea Evaluation
Este artigo explora o treinamento de modelos de linguagem para prever o sucesso empírico de ideias de pesquisa, avaliando pares de ideias em relação a resultados objetivos. O SFT melhora significativamente o desempenho além do GPT-5, e o RLVR pode treinar modelos para descobrir caminhos de raciocínio interpretáveis para essa tarefa de previsão.
27