RESEARCH27
Mahjax: A GPU-Accelerated Mahjong Simulator for Reinforcement Learning in JAX
arXiv CS.AI·21 de maio de 2026
Mahjax é um novo simulador de Riichi Mahjong totalmente vetorizado, implementado em JAX e otimizado para GPUs, visando acelerar a pesquisa em aprendizado por reforço. Ele permite a paralelização em larga escala e o aprendizado tabula rasa, oferecendo uma ferramenta de visualização para depuração e interação com agentes treinados.
Ler original ↗