← heapsort-ai

game theory

7 items

RESEARCHarXiv CS.LG·21d atrás

A Structural Threshold in Decision Capacity Governs Collapse in Self-Play Reinforcement Learning

Este artigo revela que um limiar na capacidade de decisão determina o colapso de agentes de aprendizado por reforço em auto-jogo sob perturbações de regras. A eliminação de decisões contingentes com alcance positivo leva ao colapso, enquanto a preservação de apenas uma evita isso, com o fenômeno sendo reversível e intensificado pela aproximação de função.

28
RESEARCHarXiv CS.LG·14d atrás

Truthful Online Preference Aggregation for LLM Fine-Tuning in Mobile Crowdsourcing

Este artigo investiga a agregação online verídica de preferências para o ajuste fino de Grandes Modelos de Linguagem (LLMs) em crowdsourcing móvel. Propõe um novo mecanismo de agregação ponderada online para enfrentar trabalhadores que relatam estrategicamente suas preferências, modelando o processo como um jogo Bayesiano dinâmico. O objetivo é superar as abordagens existentes que falham em identificar o trabalhador mais preciso e resultam em um arrependimento linear.

27
ARTICLEDEV.to AI·13/04/2026

当“竞价”演变为“认知套利”,SEM 流量的本质是什么?

A análise de SEM revela que a "competição de lances" se transformou em um "imposto de sobrevivência" e jogo de soma negativa, forçando empresas à "caridade corporativa". Jogadores avançados focam em "arbitragem cognitiva", corrigindo percepções do usuário e construindo confiança para alcançar um crescimento assimétrico, exigindo auditoria rigorosa de ROI e compreensão de algoritmos.

27