heapsort
RESEARCH30

Discrete Tilt Matching

arXiv CS.LG·22 de abril de 2026

Discrete Tilt Matching (DTM) é um novo método sem verossimilhança para ajuste fino de modelos de linguagem grandes de difusão mascarada (dLLMs), superando a intratabilidade de probabilidades marginais. Ele reformula o ajuste fino como correspondência em nível de estado e utiliza um objetivo de entropia cruzada ponderada com variâncias de controle para estabilidade, mostrando ganhos significativos em tarefas como Sudoku e Countdown.

Ler original