RESEARCH27
Length Value Model: Scalable Value Pretraining for Token-Level Length Modeling
arXiv CS.CL·1 de mayo de 2026
Este artículo presenta el Length Value Model (LenVM), un nuevo marco a nivel de token para modelar la longitud de generación restante en modelos autorregresivos. Al formular el modelado de la longitud como un problema de estimación de valor, LenVM proporciona una señal eficaz, sin anotaciones y escalable para LLM y VLM, mejorando el rendimiento en la coincidencia exacta de longitud.
Leer original ↗