RESEARCHarXiv CS.LG·14d atrás
Truthful Online Preference Aggregation for LLM Fine-Tuning in Mobile Crowdsourcing
Este artigo investiga a agregação online verídica de preferências para o ajuste fino de Grandes Modelos de Linguagem (LLMs) em crowdsourcing móvel. Propõe um novo mecanismo de agregação ponderada online para enfrentar trabalhadores que relatam estrategicamente suas preferências, modelando o processo como um jogo Bayesiano dinâmico. O objetivo é superar as abordagens existentes que falham em identificar o trabalhador mais preciso e resultam em um arrependimento linear.
27