heapsort
RESEARCH27

Mahjax: A GPU-Accelerated Mahjong Simulator for Reinforcement Learning in JAX

arXiv CS.AI·21 de maio de 2026

Mahjax é um novo simulador de Riichi Mahjong totalmente vetorizado, implementado em JAX e otimizado para GPUs, visando acelerar a pesquisa em aprendizado por reforço. Ele permite a paralelização em larga escala e o aprendizado tabula rasa, oferecendo uma ferramenta de visualização para depuração e interação com agentes treinados.

Ler original