heapsort
RESEARCH27

Rethinking Token Prediction: Tree-Structured Diffusion Language Model

arXiv CS.CL·April 7, 2026

Este trabalho propõe um modelo de linguagem de difusão com estrutura de árvore para otimizar o treinamento e reduzir o uso de parâmetros e memória em modelos de difusão discretos. Ele substitui a previsão de vocabulário completo pela exploração da estrutura inerente dos tokens através de uma árvore de vocabulário pré-construída, utilizando estados latentes intermediários.

Read original