Skip a Layer or Loop It? Learning Program-of-Layers in LLMs
Esta pesquisa propõe "program-of-layers (PoLar)" para LLMs, permitindo o salto ou loop dinâmico de camadas pré-treinadas durante a inferência para alcançar precisão igual ou superior com caminhos de execução mais curtos. Uma rede de previsão leve aprende a gerar esses programas personalizados, demonstrando desempenho aprimorado em benchmarks de raciocínio matemático.