RESEARCHarXiv CS.AI·vor 4T
Stability vs. Manipulability: Evaluating Robustness Under Post-Decision Interaction in LLM Judges
Diese Studie untersucht die Stabilität und Manipulierbarkeit von LLM-Juroren in Bewertungs-Pipelines und stellt fest, dass sie zwar bei neutraler Neubewertung stabil sind, aber unter gezielter Herausforderung nach der Entscheidung reversibel werden. Die Forschung zeigt, dass stabile Urteile durch motivierte Interaktion aufgehoben werden können.
28