heapsort
RESEARCH27

Mahjax: A GPU-Accelerated Mahjong Simulator for Reinforcement Learning in JAX

arXiv CS.AI·21 mai 2026

Mahjax est un nouvel environnement Riichi Mahjong entièrement vectorisé implémenté en JAX, conçu pour permettre une parallélisation à grande échelle sur GPU pour la recherche en apprentissage par renforcement. Il facilite l'apprentissage tabula rasa et comprend un outil de visualisation de haute qualité pour le débogage des agents entraînés.

Lire l'original