Diffusion Models

41 items

RESEARCHarXiv CS.AI·hace 1d

DiBS: Diffusion-Informed Branch Selection

El artículo introduce DiBS, un nuevo enfoque guiado por un modelo de difusión para la selección de ramas en la resolución de Sudoku, un problema de satisfacción de restricciones. Mejora los solucionadores simbólicos utilizando un modelo de difusión para guiar el orden de las ramas, asegurando la completitud y mitigando problemas de búsqueda de cola larga.

branch selection Diffusion Models constraint satisfaction Sudoku

RESEARCHarXiv CS.CL·hace 1d

Data-Efficient Autoregressive-to-Diffusion Language Models via On-Policy Distillation

Este artículo presenta el Modelo de Lenguaje de Difusión On-Policy (OPDLM) para transformar modelos autorregresivos (ARLMs) en modelos de lenguaje de difusión (DLMs). Aborda problemas como la pérdida de conocimiento y el desajuste entre entrenamiento e inferencia mediante el uso de la Destilación On-Policy (OPD).

Diffusion Models language models AI models machine learning

RESEARCHarXiv CS.LG·hace 20h

Enabling KV Caching of Shared Prefix for Diffusion Language Models

El artículo presenta "bicache", la primera técnica de caché KV para prefijos compartidos en modelos de lenguaje de difusión (DLMs), abordando desafíos donde los métodos de caché de LLM existentes fallan debido a la atención bidireccional de los DLMs. Este nuevo enfoque busca desbloquear el servicio de DLM de alto rendimiento, aprovechando observaciones sobre la estabilidad de los KVs de prefijos compartidos en capas poco profundas.

Diffusion Models KV Caching Performance optimization High-throughput serving

RESEARCH↑ trendingReddit r/LocalLLaMA·10/4/2026

National University of Singapore Presents "DMax": A New Paradigm For Diffusion Language Models (dLLMs) Enabling Aggressive Parallel Decoding.

DMax é um novo paradigma para modelos de linguagem de difusão (dLLMs) eficientes que mitiga o acúmulo de erros na decodificação paralela. Ele permite um paralelismo agressivo ao reformular a decodificação como um processo de auto-refinamento progressivo e introduzir uma estratégia de treinamento unificada.

Diffusion Models Parallel Decoding natural language processing AI

ARTICLE↑ trendingReddit r/MachineLearning·21/4/2026

Bulding my own Diffusion Language Model from scratch was easier than I thought [P]

El autor construyó un modelo de lenguaje de difusión desde cero para comprender mejor conceptos complejos, sin la ayuda de código generado por IA. Entrenó el modelo de 7.5M parámetros con el pequeño conjunto de datos de Shakespeare y compartió el código en GitHub.

Diffusion Models language models personal-project machine learning

RESEARCHarXiv CS.LG·hace 1d

FAIR-Calib: Frontier-Aware Instability-Reweighted Calibration for Post-Training Quantization of Diffusion Large Language Models

Los Modelos de Lenguaje Grandes de Difusión (dLLMs) experimentan un "retraso de estabilidad" debido a la confirmación irreversible de tokens, un problema agravado por errores de Cuantificación Post-Entrenamiento (PTQ). FAIR-Calib propone un marco PTQ de dos etapas que utiliza un prior de posición y calibración por capa para proteger estados de frontera frágiles, mejorando la cuantificación para dLLMs.

Diffusion Models post-training quantization quantization AI calibration

ARTICLEDEV.to AI·22/4/2026

The Unfinished Frame

El autor explora la belleza y la honestidad de pausar modelos de difusión a mitad de la renderización, encontrando estos marcos inacabados más reveladores que las imágenes finales pulidas. Estas etapas, donde los modelos de IA aún están "pensando" y negociando características de sus datos de entrenamiento, se describen como una "confesión" en lugar de una "declaración".

Diffusion Models creative process AI art AI philosophy

RESEARCHarXiv CS.CL·22/4/2026

Remask, Don't Replace: Token-to-Mask Refinement in Masked Diffusion Language Models

Este artículo propone una nueva técnica, Token-to-Mask (T2M) remasking, para refinar modelos de lenguaje de difusión enmascarados como LLaDA2.1. El método aborda las deficiencias de la edición Token-to-Token (T2T) al restablecer los tokens sospechosos a un estado de máscara, permitiendo una predicción más precisa.

Diffusion Models language models error correction natural language processing

RESEARCHarXiv CS.LG·22/4/2026

Discrete Tilt Matching

Discrete Tilt Matching (DTM) es un nuevo método sin verosimilitud para el ajuste fino de grandes modelos de lenguaje de difusión enmascarada (dLLMs), abordando la intratabilidad de las probabilidades marginales. Este método reformula el ajuste fino como coincidencia a nivel de estado y emplea un objetivo de entropía cruzada ponderada con varianzas de control, logrando mejoras notables en tareas como Sudoku y Countdown.

Diffusion Models LLMs reinforcement learning machine learning

RESEARCHarXiv CS.CL·13/4/2026

Re-Mask and Redirect: Exploiting Denoising Irreversibility in Diffusion Language Models

El artículo revela una vulnerabilidad crítica en los modelos de lenguaje basados en difusión (dLLMs) donde su alineación de seguridad, basada en programas de denoising monotónicos, puede ser fácilmente eludida. Al volver a enmascarar tokens de rechazo e inyectar un prefijo afirmativo, los investigadores lograron altas tasas de éxito de ataque contra dLLMs destacados, exponiendo una falla estructural.

Diffusion Models language models vulnerability Exploitation

RESEARCHarXiv CS.LG·hace 19d

Provably Learning Diffusion Models under the Manifold Hypothesis: Collapse and Refine

Este artículo ofrece una explicación teórica sobre la eficiencia de los modelos de difusión al aprender la función de score para datos de alta dimensión en variedades de baja dimensión. Identifica un mecanismo de "colapso y refinamiento" impulsado por la geometría de la función de score, donde el mapa de eliminación de ruido se proyecta en la variedad de datos y refina la densidad intrínseca.

Diffusion Models Theoretical AI machine learning Manifold Learning

ARTICLEDEV.to AI·23/4/2026

From DALL-E to gpt-image-2: The Architectural Bet That Finally Fixed AI Text

El nuevo modelo gpt-image-2 de OpenAI ha resuelto el antiguo problema de la incapacidad de la IA para renderizar texto y diseños complejos con precisión en imágenes. Este pivote arquitectónico representa un avance significativo, que exige una reevaluación de los flujos de trabajo basados en modelos de difusión.

Diffusion Models AI image generation AI architecture GPT

RESEARCHarXiv CS.LG·14/4/2026

The Diffusion-Attention Connection

Esta investigación unifica Transformers, mapas de difusión y Laplacianos magnéticos, mostrándolos como diferentes regímenes de una única geometría de Markov. El estudio define una "bidivergencia" QK para conectar atención y difusión, organizando sus dinámicas con producto de expertos y puentes de Schrödinger.

Diffusion Models Deep Learning Theory Markov Geometry attention mechanisms

RESEARCHDEV.to AI·10/5/2026

Diffusion models approach AR quality and improve inference speed

Los modelos de lenguaje de difusión están logrando ganancias significativas de rendimiento y reduciendo la brecha con los decodificadores autorregresivos en la velocidad de inferencia. Los nuevos Modelos de Lenguaje de Difusión Introspectivos (I-DLM) abordan problemas previos de consistencia introspectiva y bucles de muestreo ineficientes, mejorando tanto la calidad como la latencia.

inference speed Diffusion Models language models machine learning

RESEARCHarXiv CS.LG·hace 21d

Systematic Optimization of Real-Time Diffusion Model Inference on Apple M3 Ultra

Esta investigación optimiza sistemáticamente la inferencia de modelos de difusión en tiempo real en el Apple M3 Ultra, explorando varias técnicas como la conversión CoreML y la cuantificación. El estudio logró 22.7 FPS para la transformación img2img de 512x512 combinando la conversión CoreML del SDXS-512 con una tubería de cámara de 3 hilos.

Diffusion Models Optimization apple-silicon image generation

ARTICLEDEV.to AI·17/4/2026

Why Every AI Image Generator Fails at Text (And One That Finally Doesn't)

Este artículo analiza por qué los generadores de imágenes de IA, como Stable Diffusion y Midjourney, fallan sistemáticamente al renderizar texto, explicando que el problema radica en cómo los modelos de difusión aprenden patrones visuales. Sin embargo, señala la existencia de un modelo que finalmente ha superado esta limitación común.

Diffusion Models AI image generation AI limitations

RESEARCHarXiv CS.LG·hace 27d

Steering Without Breaking: Mechanistically Informed Interventions for Discrete Diffusion Language Models

Este artículo investiga las limitaciones de las intervenciones uniformes en los modelos de lenguaje de difusión discreta (DLMs), mostrando que degradan la calidad de la generación controlada. Los autores descubren que diferentes atributos se consolidan en etapas distintas del proceso de denoising, proponiendo un programador adaptativo para concentrar las intervenciones de manera eficiente.

Diffusion Models language models Controlled Generation text generation

RESEARCHarXiv CS.CL·hace 12d

From AR to Diffusion: Efficiently Adapting Large Language Models with Strictly Causal and Elastic Horizons

FLUID es un nuevo framework que adapta eficientemente modelos autorregresivos (AR) al paradigma de difusión para la generación paralela de texto. Permite la inicialización desde modelos tipo GPT e introduce un mecanismo de denoising dinámico, logrando un rendimiento de vanguardia con costos de entrenamiento significativamente menores.

Diffusion Models text generation large language models Autoregressive Models

RESEARCHarXiv CS.LG·6/4/2026

Not All Denoising Steps Are Equal: Model Scheduling for Faster Masked Diffusion Language Models

Este trabalho explora o agendamento de modelos para acelerar os Modelos de Linguagem de Difusão Mascarada (MDLMs), substituindo o modelo completo por um menor em certas etapas de denoising. A pesquisa mostra que as etapas iniciais e finais são mais robustas a essa substituição, permitindo uma redução de até 17% nos FLOPs com degradação mínima na perplexidade generativa.

Diffusion Models language models Computational Efficiency denoising

RESEARCHarXiv CS.CL·hace 15d

Learnability-Informed Fine-Tuning of Diffusion Language Models

Esta investigación introduce LIFT, un algoritmo de ajuste fino informado por la "learnability" (capacidad de aprendizaje), diseñado para mejorar las capacidades de razonamiento de los modelos de lenguaje de difusión. LIFT aborda las deficiencias del SFT estándar aprendiendo tokens de forma adaptativa según su dificultad y el contexto disponible en diferentes pasos de tiempo de difusión, mostrando un rendimiento mejorado.

Diffusion Models learning machine learning natural language processing