← heapsort-ai

Preference Aggregation

1 items

RESEARCHarXiv CS.LG·il y a 14j

Truthful Online Preference Aggregation for LLM Fine-Tuning in Mobile Crowdsourcing

Cet article étudie l'agrégation de préférences en ligne véridique pour l'ajustement fin des grands modèles linguistiques (LLM) dans le crowdsourcing mobile. Il propose un nouveau mécanisme d'agrégation pondérée en ligne pour faire face aux déclarations stratégiques des travailleurs, modélisant le processus comme un jeu bayésien dynamique. L'objectif est de surmonter les approches existantes qui ne parviennent pas à identifier le travailleur le plus précis et entraînent un regret linéaire.

27