heapsort
RESEARCH60

Skip a Layer or Loop It? Learning Program-of-Layers in LLMs

arXiv CS.LG·8 de junio de 2026

Esta investigación propone "program-of-layers (PoLar)" para LLMs, que permite omitir o repetir dinámicamente capas preentrenadas durante la inferencia para lograr una precisión igual o mejor con rutas de ejecución más cortas. Se propone una red de predicción ligera para generar estos programas personalizados, mostrando un rendimiento mejorado en pruebas de razonamiento matemático.

Leer original