← heapsort-ai

Diffusion Models

41 items

RESEARCHarXiv CS.CL·26d atrás

Differences in Text Generated by Diffusion and Autoregressive Language Models

Esta pesquisa explora as diferenças intrínsecas no texto gerado por Modelos de Linguagem de Difusão (DLMs) e Modelos de Linguagem Autorregressivos (ARMs), descobrindo que os DLMs exibem menor entropia n-gram, mas maior coerência e diversidade semântica. Experimentos controlados sugerem que os objetivos de treinamento dos DLMs contribuem para a coerência e diversidade semântica, enquanto os algoritmos de decodificação são responsáveis pela redução da entropia.

27
NEWSDEV.to AI·18d atrás

6.4 Claim Puts Nemotron-Labs Diffusion in AI Fast Lane

O Nemotron-Labs Diffusion da NVIDIA visa acelerar aplicações de IA ao abordar o gargalo de um token através da geração paralela de múltiplos tokens. Este novo modelo de linguagem de difusão afirma atingir até 6,4 vezes mais tokens por passagem direta, beneficiando significativamente produtos de IA sensíveis à latência, como assistentes de codificação e fluxos de trabalho de agentes.

27
RESEARCHDEV.to AI·29d atrás

AI/ML Research Digest — May 09, 2026

Este resumo de pesquisa em IA/ML aborda avanços em modelos de difusão latente para geração multimodal, focando na eficiência e na extensão das capacidades de imagens para vídeo. Também destaca inovações em roteamento modular de especialistas para redes neurais e métodos de computação adaptativa para otimizar processos de tomada de decisão sequencial.

27
RESEARCHarXiv CS.LG·09/04/2026

$S^3$: Stratified Scaling Search for Test-Time in Diffusion Language Models

O trabalho propõe $S^3$ (Stratified Scaling Search), um método de busca guiado por verificador para melhorar a qualidade de geração em modelos de linguagem de difusão durante o tempo de inferência. Ele realoca a computação no processo de denoising, avaliando e reamostrando seletivamente candidatos promissores para favorecer saídas de maior qualidade.

27
RESEARCHarXiv CS.LG·01/05/2026

Simple Self-Conditioning Adaptation for Masked Diffusion Models

Modelos de difusão mascarada (MDMs) descartam previsões para tokens que permanecem mascarados, limitando o refinamento entre passos. Este artigo propõe os Modelos de Difusão Mascarada Auto-Condicionados (SCMDM), uma adaptação pós-treinamento que condiciona cada passo de denoising nas previsões anteriores do próprio modelo. Isso melhora o desempenho sem mudanças arquitetônicas significativas ou avaliações adicionais.

27
RESEARCHarXiv CS.CL·08/05/2026

Chainwash: Multi-Step Rewriting Attacks on Diffusion Language Model Watermarks

Este estudo investiga ataques de reescrita multi-passos a marcas d'água em modelos de linguagem de difusão, que visam verificar a autoria de texto por IA. Os resultados demonstram que textos marcados com água podem ter sua detecção comprometida após múltiplas reescritas por outros modelos de linguagem, mesmo aqueles sem conhecimento da chave da marca d'água.

27
RESEARCHarXiv CS.LG·25d atrás

Beyond Mode-Seeking RL: Trajectory-Balance Post-Training for Diffusion Language Models

Este artigo apresenta TraFL, uma nova abordagem de pós-treinamento para modelos de linguagem de difusão que aborda o "travamento de trajetória" encontrado em métodos de maximização de recompensa. TraFL, um objetivo de equilíbrio de trajetória, supera outros métodos em benchmarks de raciocínio matemático e geração de código.

27
RESEARCHarXiv CS.LG·29d atrás

Conditional generation of antibody sequences with classifier-guided germline-absorbing discrete diffusion

Esta pesquisa introduz uma nova abordagem para a geração condicional de sequências de anticorpos, superando as limitações dos modelos de linguagem de proteínas existentes ao modelar melhor a variação somática e permitir a geração guiada por classificadores flexíveis. Ela propõe ajuste fino por difusão discreta e difusão absorvente da linha germinativa para melhorar o design de anticorpos.

27
RESEARCHarXiv CS.LG·27d atrás

TMPO: Trajectory Matching Policy Optimization for Diverse and Efficient Diffusion Alignment

O Trajectory Matching Policy Optimization (TMPO) aborda o problema de recompensa excessiva em modelos de difusão por reforço, que frequentemente causam colapso de modo e reduzem a diversidade generativa. Ele substitui a maximização de recompensa escalar pelo ajuste da distribuição de recompensa em nível de trajetória, utilizando um objetivo de Softmax Trajectory Balance para alinhar as probabilidades da política com uma distribuição de Boltzmann induzida por recompensa.

27
RESEARCHarXiv CS.LG·27d atrás

LEAP: Unlocking dLLM Parallelism via Lookahead Early-Convergence Token Detection

Modelos de Linguagem de Difusão (dLLMs) enfrentam limites de escalabilidade no paralelismo devido a limiares de confiança excessivamente conservadores que restringem seu potencial de processamento altamente paralelo. Este artigo apresenta o LEAP, um método plug-and-play sem treinamento que melhora o paralelismo dos dLLMs detectando tokens de convergência precoce, acelerando assim a decodificação.

27
RESEARCHarXiv CS.AI·11d atrás

Orthogonal Concept Erasure for Diffusion Models

Este artigo de pesquisa investiga as limitações dos métodos atuais de exclusão de conceitos para mitigar conteúdo indesejado em modelos de difusão. Ele identifica que as atualizações de parâmetros aditivos em métodos baseados em edição causam emaranhamento entre a semântica do conceito e a capacidade generativa geral, propondo uma nova solução para aprimorar a precisão e a preservação.

27
RESEARCHarXiv CS.CL·12d atrás

ICG: Improving Cover Image Generation via MLLM-based Prompting and Personalized Preference Alignment

O artigo propõe ICG, um novo framework para geração personalizada de imagens de capa que integra prompt baseado em MLLM com alinhamento de preferência. Ele utiliza características semânticas e embeddings de usuário para contextualizar o modelo de difusão e adota uma estratégia de aprendizado multi-recompensa para abordar a falta de supervisão rotulada.

27