← heapsort-ai

Mahjong

1 items

RESEARCHarXiv CS.AI·vor 20T

Mahjax: A GPU-Accelerated Mahjong Simulator for Reinforcement Learning in JAX

Mahjax ist eine neue, vollständig vektorisierte Riichi Mahjong-Umgebung, implementiert in JAX, die eine großflächige Rollout-Parallelisierung auf GPUs für die Forschung im Bereich des Reinforcement Learnings ermöglicht. Sie erleichtert das Tabula-rasa-Lernen und enthält ein hochwertiges Visualisierungstool zur Fehlerbehebung und Interaktion mit trainierten Agenten.

27