RESEARCH27

Teaching Language Models to Forecast Research Success Through Comparative Idea Evaluation

arXiv CS.LG·23 de mayo de 2026

Este artículo explora el entrenamiento de modelos de lenguaje para pronosticar el éxito empírico de ideas de investigación mediante la evaluación comparativa de pares de ideas. El SFT mejora significativamente el rendimiento en comparación con GPT-5, y el RLVR entrena modelos para descubrir rutas de razonamiento interpretables para esta tarea de pronóstico.

language models research evaluation machine learning AI forecasting scientific research

Leer original ↗