research evaluation — artigos, notícias e pesquisas de IA

RESEARCHarXiv CS.LG·18d atrás

Teaching Language Models to Forecast Research Success Through Comparative Idea Evaluation

Este artigo explora o treinamento de modelos de linguagem para prever o sucesso empírico de ideias de pesquisa, avaliando pares de ideias em relação a resultados objetivos. O SFT melhora significativamente o desempenho além do GPT-5, e o RLVR pode treinar modelos para descobrir caminhos de raciocínio interpretáveis para essa tarefa de previsão.

language models research evaluation machine learning AI forecasting