RESEARCH27
Length Value Model: Scalable Value Pretraining for Token-Level Length Modeling
arXiv CS.CL·1 de maio de 2026
Este artigo apresenta o Length Value Model (LenVM), uma nova estrutura em nível de token para modelar o comprimento de geração restante em modelos autorregressivos. Ao formular o problema como estimativa de valor, o LenVM fornece um sinal eficaz, livre de anotações e escalável para LLMs e VLMs, melhorando o desempenho na correspondência exata de comprimento.
Ler original ↗