← heapsort-ai

game theory

7 items

RESEARCHarXiv CS.LG·hace 22d

A Structural Threshold in Decision Capacity Governs Collapse in Self-Play Reinforcement Learning

Este artículo demuestra que un umbral en la capacidad de decisión rige el colapso en agentes de aprendizaje por refuerzo de auto-juego bajo perturbaciones de reglas. La eliminación de todas las decisiones contingentes de alcance positivo provoca un colapso rápido, mientras que preservar incluso una sola evita esta caída.

28
RESEARCHarXiv CS.LG·hace 15d

Truthful Online Preference Aggregation for LLM Fine-Tuning in Mobile Crowdsourcing

Este artículo investiga la agregación online veraz de preferencias para el ajuste fino de Grandes Modelos de Lenguaje (LLMs) en crowdsourcing móvil. Propone un nuevo mecanismo de agregación ponderada online para abordar la presentación estratégica de informes por parte de los trabajadores, modelando el proceso como un juego Bayesiano dinámico. El objetivo es superar los enfoques existentes que no logran identificar al trabajador más preciso y resultan en un arrepentimiento lineal.

27
ARTICLEDEV.to AI·13/4/2026

当“竞价”演变为“认知套利”,SEM 流量的本质是什么?

El análisis de SEM revela que la "subasta" ha evolucionado a un "impuesto de supervivencia" y un juego de suma negativa, llevando a las empresas a la "caridad corporativa". Los jugadores avanzados se centran en el "arbitraje cognitivo", corrigiendo percepciones del usuario y construyendo confianza para un crecimiento asimétrico, exigiendo una auditoría estricta del ROI y la comprensión de algoritmos.

27