RESEARCH30
Discrete Tilt Matching
arXiv CS.LG·22 de abril de 2026
Discrete Tilt Matching (DTM) é um novo método sem verossimilhança para ajuste fino de modelos de linguagem grandes de difusão mascarada (dLLMs), superando a intratabilidade de probabilidades marginais. Ele reformula o ajuste fino como correspondência em nível de estado e utiliza um objetivo de entropia cruzada ponderada com variâncias de controle para estabilidade, mostrando ganhos significativos em tarefas como Sudoku e Countdown.
Ler original ↗