heapsort
RESEARCH27

SpecTr-GBV: Multi-Draft Block Verification Accelerating Speculative Decoding

arXiv CS.CL·30 de abril de 2026

SpecTr-GBV é um novo método de decodificação especulativa que unifica estratégias multi-rascunho e verificação de bloco gulosa para acelerar a inferência de modelos de linguagem. Ele formula a etapa de verificação como um problema de transporte ótimo, melhorando a eficiência teórica e o desempenho empírico ao atingir o comprimento de aceitação ideal.

Ler original