RESEARCH27
Mahjax: A GPU-Accelerated Mahjong Simulator for Reinforcement Learning in JAX
arXiv CS.AI·21 de mayo de 2026
Mahjax es un nuevo entorno de Riichi Mahjong completamente vectorizado implementado en JAX, diseñado para permitir la paralelización a gran escala en GPUs para la investigación de aprendizaje por refuerzo. Facilita el aprendizaje tabula rasa y ofrece una herramienta de visualización de alta calidad para depurar agentes entrenados.
Leer original ↗