← heapsort-ai

research evaluation

1 items

RESEARCHarXiv CS.LG·18d atrás

Teaching Language Models to Forecast Research Success Through Comparative Idea Evaluation

Este artigo explora o treinamento de modelos de linguagem para prever o sucesso empírico de ideias de pesquisa, avaliando pares de ideias em relação a resultados objetivos. O SFT melhora significativamente o desempenho além do GPT-5, e o RLVR pode treinar modelos para descobrir caminhos de raciocínio interpretáveis para essa tarefa de previsão.

27