RESEARCH27
Truthful Online Preference Aggregation for LLM Fine-Tuning in Mobile Crowdsourcing
arXiv CS.LG·26 de mayo de 2026
Este artículo investiga la agregación online veraz de preferencias para el ajuste fino de Grandes Modelos de Lenguaje (LLMs) en crowdsourcing móvil. Propone un nuevo mecanismo de agregación ponderada online para abordar la presentación estratégica de informes por parte de los trabajadores, modelando el proceso como un juego Bayesiano dinámico. El objetivo es superar los enfoques existentes que no logran identificar al trabajador más preciso y resultan en un arrepentimiento lineal.
Leer original ↗