heapsort
RESEARCH27

Mahjax: A GPU-Accelerated Mahjong Simulator for Reinforcement Learning in JAX

arXiv CS.AI·21 de mayo de 2026

Mahjax es un nuevo entorno de Riichi Mahjong completamente vectorizado implementado en JAX, diseñado para permitir la paralelización a gran escala en GPUs para la investigación de aprendizaje por refuerzo. Facilita el aprendizaje tabula rasa y ofrece una herramienta de visualización de alta calidad para depurar agentes entrenados.

Leer original