Diffusion Models

41 items

RESEARCHarXiv CS.CL·hace 27d

Differences in Text Generated by Diffusion and Autoregressive Language Models

Esta investigación examina las diferencias inherentes en el texto generado por Modelos de Lenguaje de Difusión (DLM) y Modelos de Lenguaje Autorregresivos (ARM), encontrando que los DLM muestran menor entropía n-grama, pero mayor coherencia y diversidad semántica. Experimentos controlados indican que los objetivos de entrenamiento de los DLM contribuyen a la coherencia y diversidad semántica, mientras que los algoritmos de decodificación son responsables de la reducción de la entropía.

Diffusion Models language models NLP text generation

ARTICLEDEV.to AI·11/5/2026

Before the image knows what it is

El texto explora el breve momento durante la generación de imágenes por modelos de difusión, cuando el ruido se organiza en intención antes de tomar forma. Este momento de latencia es donde reside el arte, antes de que la imagen se defina.

Diffusion Models creativity AI art Generative AI

NEWSDEV.to AI·hace 18d

6.4 Claim Puts Nemotron-Labs Diffusion in AI Fast Lane

Nemotron-Labs Diffusion de NVIDIA busca acelerar las aplicaciones de IA abordando el cuello de botella de un token mediante la generación paralela de múltiples tokens. Este nuevo modelo de lenguaje de difusión afirma lograr hasta 6.4 veces más tokens por pasada directa, beneficiando significativamente a productos de IA sensibles a la latencia como asistentes de codificación y flujos de trabajo de agentes.

Diffusion Models language models AI NVIDIA

RESEARCHHugging Face Blog·hace 18d

Towards Speed-of-Light Text Generation with Nemotron-Labs Diffusion Language Models

Este contenido trata sobre el desarrollo de modelos de lenguaje de difusión de Nemotron-Labs con el objetivo de lograr una generación de texto a una velocidad excepcionalmente alta. Se centra en los avances técnicos para optimizar la rapidez de la producción textual.

Diffusion Models language models Nemotron-Labs text generation

NEWSDEV.to AI·hace 9d

Bonsai Image 4B: difusión de 1 bit que corre en un iPhone

Bonsai Image 4B de PrismML es una familia de modelos de generación de imágenes que utiliza pesos de 1 bit o ternarios para ejecutar difusión de alta calidad directamente en dispositivos como iPhones. Este modelo logra una compresión de 8,3 veces, reduciendo su tamaño de 7,75 GB a 0,93 GB, manteniendo hasta el 95% de la calidad original.

Diffusion Models Edge AI image generation PrismML

RESEARCHDEV.to AI·hace 20d

DualFashion: Dual-Diffusion Transformer Generates Outfit Images & Text

DualFashion es una arquitectura Transformer de doble difusión que genera conjuntamente imágenes de moda y descripciones textuales. Supera a los métodos de vanguardia en los benchmarks iFashion y Polyvore-U para la recomendación generativa de atuendos, ofreciendo resultados interpretables.

Diffusion Models image generation text generation fashion AI

RESEARCHDEV.to AI·11/5/2026

AI/ML Research Digest — May 09, 2026

Este resumen de investigación en IA/ML cubre avances en modelos de difusión latente para generación multimodal, centrándose en la eficiencia y la extensión de las capacidades de imágenes a vídeo. También destaca innovaciones en el enrutamiento modular de expertos para redes neuronales y métodos de computación adaptativa para optimizar procesos de toma de decisiones secuenciales.

Diffusion Models multimodal AI LLM agents machine learning

RESEARCHarXiv CS.LG·9/4/2026

$S^3$: Stratified Scaling Search for Test-Time in Diffusion Language Models

O trabalho propõe $S^3$ (Stratified Scaling Search), um método de busca guiado por verificador para melhorar a qualidade de geração em modelos de linguagem de difusão durante o tempo de inferência. Ele realoca a computação no processo de denoising, avaliando e reamostrando seletivamente candidatos promissores para favorecer saídas de maior qualidade.

Diffusion Models search algorithms language models inference

RESEARCHarXiv CS.LG·1/5/2026

Simple Self-Conditioning Adaptation for Masked Diffusion Models

Los modelos de difusión enmascarada (MDM) descartan predicciones para tokens que permanecen enmascarados, lo que limita el refinamiento entre pasos. Este artículo propone los Modelos de Difusión Enmascarada Auto-Condicionados (SCMDM), una adaptación post-entrenamiento que condiciona cada paso de denoising en las predicciones de estado limpio anteriores del propio modelo. Esto mejora el rendimiento sin cambios arquitectónicos importantes ni evaluaciones adicionales.

Diffusion Models model adaptation deep learning machine learning

RESEARCHarXiv CS.CL·8/5/2026

Chainwash: Multi-Step Rewriting Attacks on Diffusion Language Model Watermarks

Este estudio investiga ataques de reescritura de varios pasos contra marcas de agua en modelos de lenguaje de difusión, utilizados para verificar la autoría de texto por IA. Los hallazgos demuestran que los textos con marcas de agua pueden ver su detección comprometida después de múltiples reescrituras por otros modelos de lenguaje, incluso sin conocer la clave de la marca de agua.

Diffusion Models language models AI watermarking security

RESEARCHarXiv CS.CL·hace 20d

FlowLM: Few-Step Language Modeling via Diffusion-to-Flow Adaptation

FlowLM presenta un nuevo modelo de lenguaje de coincidencia de flujo, adaptado de modelos de difusión pre-entrenados mediante un ajuste fino eficiente. Este método permite la generación de texto de alta calidad en pocos pasos, superando significativamente el muestreo de difusión tradicional con menos épocas de entrenamiento.

Diffusion Models language models machine learning text generation

RESEARCHarXiv CS.LG·hace 26d

Beyond Mode-Seeking RL: Trajectory-Balance Post-Training for Diffusion Language Models

Este artículo presenta TraFL, un nuevo enfoque de post-entrenamiento para modelos de lenguaje de difusión que aborda el "bloqueo de trayectoria" encontrado en métodos de maximización de recompensa. TraFL, un objetivo de equilibrio de trayectoria, supera a otros métodos en benchmarks de razonamiento matemático y generación de código.

Diffusion Models language models reinforcement learning machine learning

RESEARCHarXiv CS.LG·11/5/2026

Conditional generation of antibody sequences with classifier-guided germline-absorbing discrete diffusion

Esta investigación presenta un enfoque novedoso para la generación condicional de secuencias de anticuerpos, abordando las limitaciones de los modelos de lenguaje de proteínas actuales al modelar mejor la variación somática y permitir la generación condicional guiada por clasificadores. Propone el ajuste fino por difusión discreta y la difusión absorbente de la línea germinal para mejorar el diseño de anticuerpos.

Antibody Design Diffusion Models computational biology protein language models

RESEARCHarXiv CS.LG·hace 28d

TMPO: Trajectory Matching Policy Optimization for Diverse and Efficient Diffusion Alignment

Trajectory Matching Policy Optimization (TMPO) aborda el problema de la recompensa excesiva en el aprendizaje por refuerzo para modelos de difusión, que a menudo causa colapso de modo y degrada la diversidad generativa. Sustituye la maximización de la recompensa escalar por la coincidencia de la distribución de recompensa a nivel de trayectoria, utilizando un objetivo de Softmax Trajectory Balance para alinear las probabilidades de la política con una distribución de Boltzmann inducida por la recompensa.

Diffusion Models reinforcement learning AI alignment Generative AI

RESEARCHarXiv CS.LG·hace 28d

LEAP: Unlocking dLLM Parallelism via Lookahead Early-Convergence Token Detection

Los Modelos de Lenguaje de Difusión (dLLMs) encuentran límites de escalabilidad en el paralelismo debido a umbrales de confianza excesivamente conservadores que restringen su potencial de procesamiento altamente paralelo. Este artículo introduce LEAP, un método plug-and-play sin entrenamiento que mejora el paralelismo de los dLLMs al detectar tokens de convergencia temprana, acelerando así la decodificación.

Diffusion Models Parallel Computing AI large language models

RESEARCHarXiv CS.AI·hace 12d

Orthogonal Concept Erasure for Diffusion Models

Este artículo de investigación examina las limitaciones de los métodos actuales de borrado de conceptos para mitigar contenido no deseado en modelos de difusión. Identifica que las actualizaciones de parámetros aditivos en métodos basados en edición provocan un entrelazamiento entre la semántica del concepto y la capacidad generativa general, proponiendo una nueva solución para mejorar la precisión y la preservación.

Diffusion Models machine learning Concept Erasure AI safety

RESEARCHarXiv CS.LG·hace 7d

Geometry-Aware Tabular Diffusion

Se introduce Geometry-Aware Tabular Diffusion (GATD) para la síntesis tabular, mejorando los denoisers con ángulos y longitudes pareadas de las diferencias de valores de columna. Logra un rendimiento de vanguardia con menos parámetros, reduciendo errores y demostrando que la supervisión relacional explícita impulsa las ganancias.

Diffusion Models data synthesis deep learning machine learning

RESEARCHarXiv CS.CL·hace 13d

ICG: Improving Cover Image Generation via MLLM-based Prompting and Personalized Preference Alignment

El artículo propone ICG, un nuevo marco para la generación personalizada de imágenes de portada que integra el prompting basado en MLLM con la alineación de preferencias. Utiliza características semánticas e incrustaciones de usuario para contextualizar el modelo de difusión y adopta una estrategia de aprendizaje de recompensas múltiples para abordar la falta de supervisión etiquetada.

personalization Diffusion Models MLLMs image generation

RESEARCHDEV.to AI·4/5/2026

Learning to Efficiently Sample from Diffusion Probabilistic Models

Esta investigación se centra en desarrollar métodos más eficientes para el muestreo de Modelos Probabilísticos de Difusión, con el objetivo de reducir el costo computacional y el tiempo asociados a la generación de muestras de alta calidad. Explora nuevos algoritmos para acelerar el proceso de muestreo manteniendo la fidelidad de los datos generados.

Diffusion Models generative models machine learning Sampling Efficiency

RESEARCHYannic Kilcher (YouTube)·27/12/2025

TiDAR: Think in Diffusion, Talk in Autoregression (Paper Analysis)

Este contenido presenta un análisis de un artículo de investigación que explora el modelo TiDAR. El modelo integra conceptos de difusión y autorregresión para su procesamiento.

Diffusion Models AI models Paper analysis Machine learning research

TiDAR: Think in Diffusion, Talk in Autoregression (Paper Analysis)