game theory

7 items

RESEARCHarXiv CS.LG·il y a 21j

A Structural Threshold in Decision Capacity Governs Collapse in Self-Play Reinforcement Learning

Cet article montre qu'un seuil dans la capacité de décision régit l'effondrement des agents d'apprentissage par renforcement en auto-apprentissage sous des perturbations asymétriques. L'élimination de toutes les décisions contingentes à portée positive entraîne un effondrement rapide, tandis que la conservation d'une seule de ces décisions empêche cet effondrement.

Decision Making reinforcement learning learning game theory

RESEARCHarXiv CS.LG·il y a 14j

Truthful Online Preference Aggregation for LLM Fine-Tuning in Mobile Crowdsourcing

Cet article étudie l'agrégation de préférences en ligne véridique pour l'ajustement fin des grands modèles linguistiques (LLM) dans le crowdsourcing mobile. Il propose un nouveau mécanisme d'agrégation pondérée en ligne pour faire face aux déclarations stratégiques des travailleurs, modélisant le processus comme un jeu bayésien dynamique. L'objectif est de surmonter les approches existantes qui ne parviennent pas à identifier le travailleur le plus précis et entraînent un regret linéaire.

Preference Aggregation machine learning game theory Crowdsourcing

RESEARCHarXiv CS.AI·il y a 14j

Quantum Frog: Emergent Cooperation and Difficulty Scaling in a Quantized-Time Cooperative Game

Cet article présente "Quantum Frog", un jeu coopératif à deux joueurs basé sur une mécanique de temps quantifié, inspiré de Frogger. Il utilise l'apprentissage par renforcement pour analyser l'évolution de la difficulté du jeu, les politiques optimales et les stratégies de coopération émergentes.

reinforcement learning multi-agent systems game theory Cooperative AI

ARTICLEDEV.to AI·13/04/2026

当“竞价”演变为“认知套利”，SEM 流量的本质是什么？

L'analyse du SEM révèle que l'enchère est devenue une "taxe de survie" et un jeu à somme négative, poussant les entreprises vers la "charité d'entreprise". Les acteurs avancés se concentrent sur l'"arbitrage cognitif", corrigeant les perceptions des utilisateurs et instaurant la confiance pour une croissance asymétrique, exigeant un audit strict du ROI et une compréhension des algorithmes.

digital-marketing Cognitive Arbitrage game theory Traffic Acquisition

RESEARCHarXiv CS.AI·09/04/2026

High-Precision Estimation of the State-Space Complexity of Shogi via the Monte Carlo Method

Este artigo estima com alta precisão a complexidade do espaço de estados do jogo Shogi (xadrez japonês), um problema desafiador. Utilizando o método Monte Carlo e uma nova busca reversa, os autores estimam o número de posições legais em $6.55 \times 10^{68}$.

Monte Carlo Computational complexity game theory Shogi

ARTICLEDEV.to AI·09/04/2026

Why Chess Is Probably Impossible to Fully Solve (At Least for Now)

Apesar de séculos de estudo e do poder computacional moderno, o xadrez permanece sem solução, pois não se sabe o resultado final com jogadas perfeitas devido à sua complexidade astronômica. O artigo define 'resolver um jogo' em computação, diferenciando entre soluções fracas e fortes.

Chess Computational complexity game theory artificial intelligence

ARTICLEDEV.to AI·il y a 19j

Title: Navigating the AI Landscape in May 2026: A Closer Look at Recent Developments

L'article explore les récents développements de l'IA en mai 2026, mettant en lumière les discussions sur les réponses de la théorie des jeux à l'adoption de l'IA. Il aborde les préoccupations concernant la création de produits inférieurs et l'utilisation abusive par des non-experts, ainsi que des applications telles que les pédales de guitare alimentées par l'IA.

AI applications AI adoption game theory