Generalization Guarantees on Data-Driven Tuning of Gradient Descent with Langevin Updates
Este artículo introduce el algoritmo Langevin Gradient Descent (LGD) para problemas de regresión convexa, demostrando que las configuraciones óptimas de hiperparámetros alcanzan la solución óptima de Bayes. El trabajo también ofrece garantías de generalización para el meta-aprendizaje de hiperparámetros óptimos de LGD, con un límite de pseudo-dimensión de O(dh).