Preference Aggregation — KI-Artikel, Nachrichten & Forschung

RESEARCHarXiv CS.LG·vor 14T

Truthful Online Preference Aggregation for LLM Fine-Tuning in Mobile Crowdsourcing

Dieses Papier untersucht die wahrheitsgemäße Online-Präferenzaggregation für das Fine-Tuning von großen Sprachmodellen (LLMs) im mobilen Crowdsourcing. Es schlägt einen neuartigen Online-gewichteten Aggregationsmechanismus vor, um strategische Falschmeldungen von Arbeitern zu adressieren, indem der Prozess als dynamisches Bayessches Spiel modelliert wird. Ziel ist es, bestehende Ansätze zu überwinden, die den genauesten Arbeiter nicht identifizieren können und zu einem linearen Regret führen.

Preference Aggregation machine learning game theory Crowdsourcing