heapsort
RESEARCH27

Length Value Model: Scalable Value Pretraining for Token-Level Length Modeling

arXiv CS.CL·1 mai 2026

Cet article présente le Length Value Model (LenVM), un nouveau cadre au niveau du token pour modéliser la longueur de génération restante dans les modèles autorégressifs. En formulant la modélisation de la longueur comme un problème d'estimation de valeur, LenVM fournit un signal efficace, sans annotation et évolutif pour les LLM et VLM, améliorant les performances sur les tâches de correspondance exacte de longueur.

Lire l'original