Diffusion Models

41 items

RESEARCHarXiv CS.CL·26d atrás

Differences in Text Generated by Diffusion and Autoregressive Language Models

Esta pesquisa explora as diferenças intrínsecas no texto gerado por Modelos de Linguagem de Difusão (DLMs) e Modelos de Linguagem Autorregressivos (ARMs), descobrindo que os DLMs exibem menor entropia n-gram, mas maior coerência e diversidade semântica. Experimentos controlados sugerem que os objetivos de treinamento dos DLMs contribuem para a coerência e diversidade semântica, enquanto os algoritmos de decodificação são responsáveis pela redução da entropia.

Diffusion Models language models NLP text generation

RESEARCHarXiv CS.LG·6d atrás

Geometry-Aware Tabular Diffusion

O GATD (Geometry-Aware Tabular Diffusion) é introduzido para a síntese tabular, aprimorando os denoisers com ângulos e comprimentos de diferenças de valores de coluna. Ele alcança desempenho de ponta com menos parâmetros, reduzindo erros e demonstrando que a supervisão relacional explícita é fundamental para os ganhos.

Diffusion Models data synthesis deep learning machine learning

ARTICLEDEV.to AI·11/05/2026

Before the image knows what it is

O texto explora o breve momento durante a criação de imagens por modelos de difusão, quando o ruído se organiza em intenção antes de tomar forma. Este momento de latência é onde a arte reside, antes que a imagem se defina.

Diffusion Models creativity AI art Generative AI

NEWSDEV.to AI·18d atrás

6.4 Claim Puts Nemotron-Labs Diffusion in AI Fast Lane

O Nemotron-Labs Diffusion da NVIDIA visa acelerar aplicações de IA ao abordar o gargalo de um token através da geração paralela de múltiplos tokens. Este novo modelo de linguagem de difusão afirma atingir até 6,4 vezes mais tokens por passagem direta, beneficiando significativamente produtos de IA sensíveis à latência, como assistentes de codificação e fluxos de trabalho de agentes.

Diffusion Models language models AI NVIDIA

RESEARCHHugging Face Blog·18d atrás

Towards Speed-of-Light Text Generation with Nemotron-Labs Diffusion Language Models

Este conteúdo aborda o desenvolvimento de modelos de linguagem de difusão da Nemotron-Labs visando a geração de texto em velocidades excepcionalmente altas. O foco está em avanços técnicos para otimizar a rapidez da produção textual.

Diffusion Models language models Nemotron-Labs text generation

NEWSDEV.to AI·9d atrás

Bonsai Image 4B: difusión de 1 bit que corre en un iPhone

A PrismML lançou o Bonsai Image 4B, uma família de modelos de geração de imagens que usa pesos de 1 bit ou ternários para executar difusão de alta qualidade em dispositivos locais como iPhones. Esta inovação resulta numa compressão de 8,3x no modelo, reduzindo-o de 7,75 GB para 0,93 GB, mantendo até 95% da qualidade original.

Diffusion Models Edge AI image generation PrismML

RESEARCHDEV.to AI·20d atrás

DualFashion: Dual-Diffusion Transformer Generates Outfit Images & Text

DualFashion é uma arquitetura Transformer de dupla difusão que gera conjuntamente imagens de moda e descrições textuais. Ele supera métodos de última geração em benchmarks iFashion e Polyvore-U para recomendação de roupas, oferecendo saídas interpretáveis.

Diffusion Models image generation text generation fashion AI

RESEARCHDEV.to AI·29d atrás

AI/ML Research Digest — May 09, 2026

Este resumo de pesquisa em IA/ML aborda avanços em modelos de difusão latente para geração multimodal, focando na eficiência e na extensão das capacidades de imagens para vídeo. Também destaca inovações em roteamento modular de especialistas para redes neurais e métodos de computação adaptativa para otimizar processos de tomada de decisão sequencial.

Diffusion Models multimodal AI LLM Agents machine learning

RESEARCHarXiv CS.LG·09/04/2026

$S^3$: Stratified Scaling Search for Test-Time in Diffusion Language Models

O trabalho propõe $S^3$ (Stratified Scaling Search), um método de busca guiado por verificador para melhorar a qualidade de geração em modelos de linguagem de difusão durante o tempo de inferência. Ele realoca a computação no processo de denoising, avaliando e reamostrando seletivamente candidatos promissores para favorecer saídas de maior qualidade.

Diffusion Models search algorithms language models inference

RESEARCHarXiv CS.LG·01/05/2026

Simple Self-Conditioning Adaptation for Masked Diffusion Models

Modelos de difusão mascarada (MDMs) descartam previsões para tokens que permanecem mascarados, limitando o refinamento entre passos. Este artigo propõe os Modelos de Difusão Mascarada Auto-Condicionados (SCMDM), uma adaptação pós-treinamento que condiciona cada passo de denoising nas previsões anteriores do próprio modelo. Isso melhora o desempenho sem mudanças arquitetônicas significativas ou avaliações adicionais.

Diffusion Models model adaptation deep learning machine learning

RESEARCHarXiv CS.CL·08/05/2026

Chainwash: Multi-Step Rewriting Attacks on Diffusion Language Model Watermarks

Este estudo investiga ataques de reescrita multi-passos a marcas d'água em modelos de linguagem de difusão, que visam verificar a autoria de texto por IA. Os resultados demonstram que textos marcados com água podem ter sua detecção comprometida após múltiplas reescritas por outros modelos de linguagem, mesmo aqueles sem conhecimento da chave da marca d'água.

Diffusion Models language models AI watermarking security

RESEARCHarXiv CS.CL·19d atrás

FlowLM: Few-Step Language Modeling via Diffusion-to-Flow Adaptation

FlowLM introduz um novo modelo de linguagem de correspondência de fluxo, adaptado de modelos de difusão pré-treinados por meio de um ajuste fino eficiente. Este método permite a geração de texto de alta qualidade em poucos passos, superando significativamente a amostragem de difusão tradicional com menos épocas de treinamento.

Diffusion Models language models machine learning text generation

RESEARCHarXiv CS.LG·25d atrás

Beyond Mode-Seeking RL: Trajectory-Balance Post-Training for Diffusion Language Models

Este artigo apresenta TraFL, uma nova abordagem de pós-treinamento para modelos de linguagem de difusão que aborda o "travamento de trajetória" encontrado em métodos de maximização de recompensa. TraFL, um objetivo de equilíbrio de trajetória, supera outros métodos em benchmarks de raciocínio matemático e geração de código.

Diffusion Models language models reinforcement learning machine learning

RESEARCHarXiv CS.LG·29d atrás

Conditional generation of antibody sequences with classifier-guided germline-absorbing discrete diffusion

Esta pesquisa introduz uma nova abordagem para a geração condicional de sequências de anticorpos, superando as limitações dos modelos de linguagem de proteínas existentes ao modelar melhor a variação somática e permitir a geração guiada por classificadores flexíveis. Ela propõe ajuste fino por difusão discreta e difusão absorvente da linha germinativa para melhorar o design de anticorpos.

Antibody Design Diffusion Models computational biology protein language models

RESEARCHarXiv CS.LG·27d atrás

TMPO: Trajectory Matching Policy Optimization for Diverse and Efficient Diffusion Alignment

O Trajectory Matching Policy Optimization (TMPO) aborda o problema de recompensa excessiva em modelos de difusão por reforço, que frequentemente causam colapso de modo e reduzem a diversidade generativa. Ele substitui a maximização de recompensa escalar pelo ajuste da distribuição de recompensa em nível de trajetória, utilizando um objetivo de Softmax Trajectory Balance para alinhar as probabilidades da política com uma distribuição de Boltzmann induzida por recompensa.

Diffusion Models reinforcement learning AI alignment Generative AI

RESEARCHarXiv CS.LG·27d atrás

LEAP: Unlocking dLLM Parallelism via Lookahead Early-Convergence Token Detection

Modelos de Linguagem de Difusão (dLLMs) enfrentam limites de escalabilidade no paralelismo devido a limiares de confiança excessivamente conservadores que restringem seu potencial de processamento altamente paralelo. Este artigo apresenta o LEAP, um método plug-and-play sem treinamento que melhora o paralelismo dos dLLMs detectando tokens de convergência precoce, acelerando assim a decodificação.

Diffusion Models Parallel Computing AI large language models

RESEARCHarXiv CS.AI·11d atrás

Orthogonal Concept Erasure for Diffusion Models

Este artigo de pesquisa investiga as limitações dos métodos atuais de exclusão de conceitos para mitigar conteúdo indesejado em modelos de difusão. Ele identifica que as atualizações de parâmetros aditivos em métodos baseados em edição causam emaranhamento entre a semântica do conceito e a capacidade generativa geral, propondo uma nova solução para aprimorar a precisão e a preservação.

Diffusion Models machine learning Concept Erasure AI safety

RESEARCHarXiv CS.CL·12d atrás

ICG: Improving Cover Image Generation via MLLM-based Prompting and Personalized Preference Alignment

O artigo propõe ICG, um novo framework para geração personalizada de imagens de capa que integra prompt baseado em MLLM com alinhamento de preferência. Ele utiliza características semânticas e embeddings de usuário para contextualizar o modelo de difusão e adota uma estratégia de aprendizado multi-recompensa para abordar a falta de supervisão rotulada.

personalization Diffusion Models MLLMs image generation

RESEARCHDEV.to AI·04/05/2026

Learning to Efficiently Sample from Diffusion Probabilistic Models

Esta pesquisa foca no desenvolvimento de métodos mais eficientes para amostragem de Modelos Probabilísticos de Difusão, visando reduzir o custo computacional e o tempo associados à geração de amostras de alta qualidade. Explora novos algoritmos para acelerar o processo de amostragem, mantendo a fidelidade dos dados gerados.

Diffusion Models generative models machine learning Sampling Efficiency

RESEARCHYannic Kilcher (YouTube)·27/12/2025

TiDAR: Think in Diffusion, Talk in Autoregression (Paper Analysis)

Este conteúdo apresenta uma análise de um artigo de pesquisa que explora o modelo TiDAR. O modelo integra conceitos de difusão e autorregressão para processamento.

Diffusion Models AI models Paper analysis Machine learning research

TiDAR: Think in Diffusion, Talk in Autoregression (Paper Analysis)