RESEARCH60
Skip a Layer or Loop It? Learning Program-of-Layers in LLMs
arXiv CS.LG·8 de junio de 2026
Esta investigación propone "program-of-layers (PoLar)" para LLMs, que permite omitir o repetir dinámicamente capas preentrenadas durante la inferencia para lograr una precisión igual o mejor con rutas de ejecución más cortas. Se propone una red de predicción ligera para generar estos programas personalizados, mostrando un rendimiento mejorado en pruebas de razonamiento matemático.
Leer original ↗