Decoupling Scores and Text: The Politeness Principle in Peer Review
Este estudo investiga a dificuldade de interpretar feedback de revisão por pares, comparando a eficácia de pontuações numéricas versus textos na previsão de aceitação. A pesquisa revela que modelos baseados em pontuações são significativamente mais precisos (91%) do que modelos baseados em texto (81% com LLMs), indicando que a informação textual é menos confiável.