RESEARCH27

Truthful Online Preference Aggregation for LLM Fine-Tuning in Mobile Crowdsourcing

arXiv CS.LG·26 de mayo de 2026

Este artículo investiga la agregación online veraz de preferencias para el ajuste fino de Grandes Modelos de Lenguaje (LLMs) en crowdsourcing móvil. Propone un nuevo mecanismo de agregación ponderada online para abordar la presentación estratégica de informes por parte de los trabajadores, modelando el proceso como un juego Bayesiano dinámico. El objetivo es superar los enfoques existentes que no logran identificar al trabajador más preciso y resultan en un arrepentimiento lineal.

Preference Aggregation machine learning game theory Crowdsourcing LLM

Leer original ↗