heapsort
RESEARCH31

Automated co-design of high-performance thermodynamic cycles via graph-based hierarchical reinforcement learning

arXiv CS.LG·16 de abril de 2026

Este estudio presenta un enfoque de aprendizaje por refuerzo jerárquico basado en grafos para el codiseño automatizado de ciclos termodinámicos de alto rendimiento. La metodología utiliza redes neuronales profundas para la decodificación y un marco de RL para la evolución estructural y la optimización de parámetros.

Leer original