RESEARCH27

Truthful Online Preference Aggregation for LLM Fine-Tuning in Mobile Crowdsourcing

arXiv CS.LG·26 mai 2026

Cet article étudie l'agrégation de préférences en ligne véridique pour l'ajustement fin des grands modèles linguistiques (LLM) dans le crowdsourcing mobile. Il propose un nouveau mécanisme d'agrégation pondérée en ligne pour faire face aux déclarations stratégiques des travailleurs, modélisant le processus comme un jeu bayésien dynamique. L'objectif est de surmonter les approches existantes qui ne parviennent pas à identifier le travailleur le plus précis et entraînent un regret linéaire.

Preference Aggregation machine learning game theory Crowdsourcing LLM

Lire l'original ↗