Decoupling Scores and Text: The Politeness Principle in Peer Review
Este estudio investiga la dificultad de interpretar la retroalimentación de la revisión por pares, comparando la eficacia de las puntuaciones numéricas frente a los textos en la predicción de aceptación. La investigación revela que los modelos basados en puntuaciones son significativamente más precisos (91%) que los modelos basados en texto (81% con LLMs), indicando que la información textual es menos fiable.