← heapsort-ai

game theory

7 items

RESEARCHarXiv CS.LG·il y a 21j

A Structural Threshold in Decision Capacity Governs Collapse in Self-Play Reinforcement Learning

Cet article montre qu'un seuil dans la capacité de décision régit l'effondrement des agents d'apprentissage par renforcement en auto-apprentissage sous des perturbations asymétriques. L'élimination de toutes les décisions contingentes à portée positive entraîne un effondrement rapide, tandis que la conservation d'une seule de ces décisions empêche cet effondrement.

28
RESEARCHarXiv CS.LG·il y a 14j

Truthful Online Preference Aggregation for LLM Fine-Tuning in Mobile Crowdsourcing

Cet article étudie l'agrégation de préférences en ligne véridique pour l'ajustement fin des grands modèles linguistiques (LLM) dans le crowdsourcing mobile. Il propose un nouveau mécanisme d'agrégation pondérée en ligne pour faire face aux déclarations stratégiques des travailleurs, modélisant le processus comme un jeu bayésien dynamique. L'objectif est de surmonter les approches existantes qui ne parviennent pas à identifier le travailleur le plus précis et entraînent un regret linéaire.

27
RESEARCHarXiv CS.AI·il y a 14j

Quantum Frog: Emergent Cooperation and Difficulty Scaling in a Quantized-Time Cooperative Game

Cet article présente "Quantum Frog", un jeu coopératif à deux joueurs basé sur une mécanique de temps quantifié, inspiré de Frogger. Il utilise l'apprentissage par renforcement pour analyser l'évolution de la difficulté du jeu, les politiques optimales et les stratégies de coopération émergentes.

27
ARTICLEDEV.to AI·13/04/2026

当“竞价”演变为“认知套利”,SEM 流量的本质是什么?

L'analyse du SEM révèle que l'enchère est devenue une "taxe de survie" et un jeu à somme négative, poussant les entreprises vers la "charité d'entreprise". Les acteurs avancés se concentrent sur l'"arbitrage cognitif", corrigeant les perceptions des utilisateurs et instaurant la confiance pour une croissance asymétrique, exigeant un audit strict du ROI et une compréhension des algorithmes.

27
ARTICLEDEV.to AI·il y a 19j

Title: **Navigating the AI Landscape in May 2026: A Closer Look at Recent Developments**

L'article explore les récents développements de l'IA en mai 2026, mettant en lumière les discussions sur les réponses de la théorie des jeux à l'adoption de l'IA. Il aborde les préoccupations concernant la création de produits inférieurs et l'utilisation abusive par des non-experts, ainsi que des applications telles que les pédales de guitare alimentées par l'IA.

21