RESEARCH28
Stability vs. Manipulability: Evaluating Robustness Under Post-Decision Interaction in LLM Judges
arXiv CS.AI·5 de junio de 2026
Este estudio investiga la estabilidad y la manipulabilidad de los jueces LLM en los procesos de evaluación, descubriendo que, aunque son estables en reevaluaciones neutrales, se vuelven reversibles bajo desafíos específicos post-decisión. La investigación demuestra que los juicios estables pueden ser anulados mediante interacción motivada.
Leer original ↗