RESEARCH27
Teaching Language Models to Forecast Research Success Through Comparative Idea Evaluation
arXiv CS.LG·23 de mayo de 2026
Este artículo explora el entrenamiento de modelos de lenguaje para pronosticar el éxito empírico de ideas de investigación mediante la evaluación comparativa de pares de ideas. El SFT mejora significativamente el rendimiento en comparación con GPT-5, y el RLVR entrena modelos para descubrir rutas de razonamiento interpretables para esta tarea de pronóstico.
Leer original ↗