← heapsort-ai

Diffusion Models

41 items

RESEARCHarXiv CS.LG·19h atrás

Enabling KV Caching of Shared Prefix for Diffusion Language Models

O artigo apresenta "bicache", a primeira técnica de cache KV para prefixos partilhados em modelos de linguagem de difusão (DLMs), abordando desafios onde métodos de cache de LLM existentes falham devido à atenção bidirecional dos DLMs. Esta nova abordagem visa permitir o serviço de DLM de alto rendimento, aproveitando observações sobre a estabilidade dos KVs de prefixos partilhados em camadas superficiais.

54
RESEARCH↑ trendingReddit r/LocalLLaMA·10/04/2026

National University of Singapore Presents "DMax": A New Paradigm For Diffusion Language Models (dLLMs) Enabling Aggressive Parallel Decoding.

DMax é um novo paradigma para modelos de linguagem de difusão (dLLMs) eficientes que mitiga o acúmulo de erros na decodificação paralela. Ele permite um paralelismo agressivo ao reformular a decodificação como um processo de auto-refinamento progressivo e introduzir uma estratégia de treinamento unificada.

44
RESEARCHarXiv CS.LG·1d atrás

FAIR-Calib: Frontier-Aware Instability-Reweighted Calibration for Post-Training Quantization of Diffusion Large Language Models

Modelos de Linguagem Grandes de Difusão (dLLMs) enfrentam um "atraso de estabilidade" devido à confirmação irreversível de tokens, problema exacerbado por erros de Quantização Pós-Treinamento (PTQ). FAIR-Calib propõe uma estrutura PTQ de duas etapas que utiliza um prior de posição e calibração por camada para proteger estados de fronteira frágeis, melhorando a quantização para dLLMs.

40
ARTICLEDEV.to AI·22/04/2026

The Unfinished Frame

O autor explora a beleza e a honestidade de pausar modelos de difusão a meio da renderização, considerando essas molduras inacabadas mais reveladoras do que as imagens finais polidas. Essas fases, onde os modelos de IA ainda estão "pensando" e negociando características dos seus dados de treinamento, são descritas como uma "confissão" em vez de uma "declaração".

34
RESEARCHarXiv CS.LG·22/04/2026

Discrete Tilt Matching

Discrete Tilt Matching (DTM) é um novo método sem verossimilhança para ajuste fino de modelos de linguagem grandes de difusão mascarada (dLLMs), superando a intratabilidade de probabilidades marginais. Ele reformula o ajuste fino como correspondência em nível de estado e utiliza um objetivo de entropia cruzada ponderada com variâncias de controle para estabilidade, mostrando ganhos significativos em tarefas como Sudoku e Countdown.

30
RESEARCHarXiv CS.CL·13/04/2026

Re-Mask and Redirect: Exploiting Denoising Irreversibility in Diffusion Language Models

O artigo revela uma vulnerabilidade crítica em modelos de linguagem baseados em difusão (dLLMs), onde seu alinhamento de segurança, dependente de agendamentos de denoising monotônicos, pode ser facilmente contornado. Ao re-mascarar tokens de recusa e injetar um prefixo afirmativo, pesquisadores obtiveram altas taxas de sucesso de ataque contra dLLMs proeminentes, expondo uma falha estrutural.

29
RESEARCHarXiv CS.LG·19d atrás

Provably Learning Diffusion Models under the Manifold Hypothesis: Collapse and Refine

Este artigo propõe uma explicação teórica para a eficiência dos modelos de difusão na aprendizagem da função de score para dados de alta dimensão em variedades de baixa dimensão. Ele identifica um mecanismo de "colapso e refinamento" impulsionado pela geometria da própria função de score, onde o mapa de denoising se projeta na variedade de dados e refina a densidade intrínseca.

29
RESEARCHDEV.to AI·10/05/2026

Diffusion models approach AR quality and improve inference speed

Modelos de linguagem de difusão estão agora alcançando ganhos significativos de throughput e diminuindo a lacuna com decodificadores autorregressivos na velocidade de inferência. Novos Modelos de Linguagem de Difusão Introspectivos (I-DLM) abordam problemas anteriores de consistência introspectiva e loops de amostragem ineficientes, melhorando tanto a qualidade quanto a latência.

28
RESEARCHarXiv CS.LG·27d atrás

Steering Without Breaking: Mechanistically Informed Interventions for Discrete Diffusion Language Models

Este artigo investiga as limitações das intervenções uniformes em modelos de linguagem de difusão discreta (DLMs), mostrando que elas degradam a qualidade da geração controlada. Os autores descobrem que diferentes atributos se consolidam em estágios distintos do processo de denoising, propondo um agendador adaptativo para concentrar as intervenções eficientemente.

28
RESEARCHarXiv CS.CL·12d atrás

From AR to Diffusion: Efficiently Adapting Large Language Models with Strictly Causal and Elastic Horizons

FLUID é um novo framework que adapta eficientemente modelos Autoregressivos (AR) ao paradigma de difusão para geração paralela de texto. Ele permite a inicialização a partir de modelos GPT e utiliza um mecanismo dinâmico de denoising, resultando em desempenho superior e custos de treinamento drasticamente reduzidos.

28
RESEARCHarXiv CS.LG·06/04/2026

Not All Denoising Steps Are Equal: Model Scheduling for Faster Masked Diffusion Language Models

Este trabalho explora o agendamento de modelos para acelerar os Modelos de Linguagem de Difusão Mascarada (MDLMs), substituindo o modelo completo por um menor em certas etapas de denoising. A pesquisa mostra que as etapas iniciais e finais são mais robustas a essa substituição, permitindo uma redução de até 17% nos FLOPs com degradação mínima na perplexidade generativa.

28
RESEARCHarXiv CS.CL·15d atrás

Learnability-Informed Fine-Tuning of Diffusion Language Models

Esta pesquisa apresenta LIFT, um algoritmo de fine-tuning informado pela capacidade de aprendizado, projetado para melhorar as capacidades de raciocínio de modelos de linguagem de difusão. LIFT supera as deficiências do SFT padrão ao aprender tokens de forma adaptativa com base em sua dificuldade e contexto disponível em diferentes etapas de tempo de difusão, demonstrando desempenho superior.

28