RESEARCH60

Skip a Layer or Loop It? Learning Program-of-Layers in LLMs

arXiv CS.LG·8 de junio de 2026

Esta investigación propone "program-of-layers (PoLar)" para LLMs, que permite omitir o repetir dinámicamente capas preentrenadas durante la inferencia para lograr una precisión igual o mejor con rutas de ejecución más cortas. Se propone una red de predicción ligera para generar estos programas personalizados, mostrando un rendimiento mejorado en pruebas de razonamiento matemático.

neural networks mathematical reasoning inference LLMs learning

Leer original ↗