← heapsort-ai

Preference Aggregation

1 items

RESEARCHarXiv CS.LG·14d atrás

Truthful Online Preference Aggregation for LLM Fine-Tuning in Mobile Crowdsourcing

Este artigo investiga a agregação online verídica de preferências para o ajuste fino de Grandes Modelos de Linguagem (LLMs) em crowdsourcing móvel. Propõe um novo mecanismo de agregação ponderada online para enfrentar trabalhadores que relatam estrategicamente suas preferências, modelando o processo como um jogo Bayesiano dinâmico. O objetivo é superar as abordagens existentes que falham em identificar o trabalhador mais preciso e resultam em um arrependimento linear.

27