← heapsort-ai

Peer review

25 items

RESEARCHarXiv CS.CL·17/04/2026

Decoupling Scores and Text: The Politeness Principle in Peer Review

Cette étude examine la difficulté d'interpréter les retours des évaluations par les pairs, comparant l'efficacité des scores numériques et des textes pour prédire l'acceptation. La recherche révèle que les modèles basés sur les scores sont nettement plus précis (91%) que ceux basés sur le texte (81% avec les LLM), indiquant que l'information textuelle est moins fiable.

27
RESEARCHarXiv CS.AI·06/05/2026

Stop Automating Peer Review Without Rigorous Evaluation

Cet article déconseille l'utilisation des systèmes d'IA actuels pour l'évaluation par les pairs, identifiant deux problèmes critiques: un "effet de ruche" qui réduit la diversité des perspectives et la facilité de manipulation des scores d'évaluation par l'IA via la réécriture de l'article. Une comparaison empirique des évaluations humaines et générées par l'IA montre que les évaluateurs IA sont sensibles aux changements stylistiques plutôt qu'au mérite scientifique, soulignant la nécessité de la non-manipulabilité et de la diversité pour l'automatisation.

27