RESEARCH27
Mahjax: A GPU-Accelerated Mahjong Simulator for Reinforcement Learning in JAX
arXiv CS.AI·21. Mai 2026
Mahjax ist eine neue, vollständig vektorisierte Riichi Mahjong-Umgebung, implementiert in JAX, die eine großflächige Rollout-Parallelisierung auf GPUs für die Forschung im Bereich des Reinforcement Learnings ermöglicht. Sie erleichtert das Tabula-rasa-Lernen und enthält ein hochwertiges Visualisierungstool zur Fehlerbehebung und Interaktion mit trainierten Agenten.
Original lesen ↗