← heapsort-ai

game theory

7 items

RESEARCHarXiv CS.LG·vor 22T

A Structural Threshold in Decision Capacity Governs Collapse in Self-Play Reinforcement Learning

Diese Arbeit zeigt, dass eine Schwelle in der Entscheidungskapazität den Kollaps von Self-Play-Reinforcement-Learning-Agenten unter asymmetrischen Regelstörungen steuert. Die Eliminierung aller positive-reach kontingenten Entscheidungen führt zu einem schnellen Kollaps, während das Beibehalten einer einzigen solchen Entscheidung dies verhindert.

28
RESEARCHarXiv CS.LG·vor 15T

Truthful Online Preference Aggregation for LLM Fine-Tuning in Mobile Crowdsourcing

Dieses Papier untersucht die wahrheitsgemäße Online-Präferenzaggregation für das Fine-Tuning von großen Sprachmodellen (LLMs) im mobilen Crowdsourcing. Es schlägt einen neuartigen Online-gewichteten Aggregationsmechanismus vor, um strategische Falschmeldungen von Arbeitern zu adressieren, indem der Prozess als dynamisches Bayessches Spiel modelliert wird. Ziel ist es, bestehende Ansätze zu überwinden, die den genauesten Arbeiter nicht identifizieren können und zu einem linearen Regret führen.

27
ARTICLEDEV.to AI·4/13/2026

当“竞价”演变为“认知套利”,SEM 流量的本质是什么?

Die SEM-Analyse argumentiert, dass das Bieten sich zu einer "Überlebenssteuer" und einem Negativsummenspiel entwickelt hat, was Unternehmen in "Unternehmenswohltätigkeit" drängt. Fortgeschrittene Akteure konzentrieren sich nun auf "kognitive Arbitrage", indem sie Nutzerwahrnehmungen korrigieren und Vertrauen für asymmetrisches Wachstum aufbauen, was eine strenge ROI-Prüfung und Algorithmusverständnis notwendig macht.

27