RESEARCHarXiv CS.AI·il y a 4j
Stability vs. Manipulability: Evaluating Robustness Under Post-Decision Interaction in LLM Judges
Cette étude examine la stabilité et la manipulabilité des juges LLM dans les pipelines d'évaluation, révélant que bien qu'ils soient stables lors de réévaluations neutres, ils deviennent réversibles sous un défi post-décision ciblé. La recherche démontre que les jugements stables peuvent être annulés par une interaction motivée.
28