RESEARCHarXiv CS.AI·19d atrás
Mahjax: A GPU-Accelerated Mahjong Simulator for Reinforcement Learning in JAX
Mahjax é um novo simulador de Riichi Mahjong totalmente vetorizado, implementado em JAX e otimizado para GPUs, visando acelerar a pesquisa em aprendizado por reforço. Ele permite a paralelização em larga escala e o aprendizado tabula rasa, oferecendo uma ferramenta de visualização para depuração e interação com agentes treinados.
27