RESEARCHarXiv CS.LG·vor 14T
Truthful Online Preference Aggregation for LLM Fine-Tuning in Mobile Crowdsourcing
Dieses Papier untersucht die wahrheitsgemäße Online-Präferenzaggregation für das Fine-Tuning von großen Sprachmodellen (LLMs) im mobilen Crowdsourcing. Es schlägt einen neuartigen Online-gewichteten Aggregationsmechanismus vor, um strategische Falschmeldungen von Arbeitern zu adressieren, indem der Prozess als dynamisches Bayessches Spiel modelliert wird. Ziel ist es, bestehende Ansätze zu überwinden, die den genauesten Arbeiter nicht identifizieren können und zu einem linearen Regret führen.
27