RESEARCHarXiv CS.AI·hace 19d
Mahjax: A GPU-Accelerated Mahjong Simulator for Reinforcement Learning in JAX
Mahjax es un nuevo entorno de Riichi Mahjong completamente vectorizado implementado en JAX, diseñado para permitir la paralelización a gran escala en GPUs para la investigación de aprendizaje por refuerzo. Facilita el aprendizaje tabula rasa y ofrece una herramienta de visualización de alta calidad para depurar agentes entrenados.
27