RESEARCH27
Truthful Online Preference Aggregation for LLM Fine-Tuning in Mobile Crowdsourcing
arXiv CS.LG·26 mai 2026
Cet article étudie l'agrégation de préférences en ligne véridique pour l'ajustement fin des grands modèles linguistiques (LLM) dans le crowdsourcing mobile. Il propose un nouveau mécanisme d'agrégation pondérée en ligne pour faire face aux déclarations stratégiques des travailleurs, modélisant le processus comme un jeu bayésien dynamique. L'objectif est de surmonter les approches existantes qui ne parviennent pas à identifier le travailleur le plus précis et entraînent un regret linéaire.
Lire l'original ↗