← heapsort-ai

Diffusion Models

41 items

RESEARCHarXiv CS.CL·hace 27d

Differences in Text Generated by Diffusion and Autoregressive Language Models

Esta investigación examina las diferencias inherentes en el texto generado por Modelos de Lenguaje de Difusión (DLM) y Modelos de Lenguaje Autorregresivos (ARM), encontrando que los DLM muestran menor entropía n-grama, pero mayor coherencia y diversidad semántica. Experimentos controlados indican que los objetivos de entrenamiento de los DLM contribuyen a la coherencia y diversidad semántica, mientras que los algoritmos de decodificación son responsables de la reducción de la entropía.

27
NEWSDEV.to AI·hace 18d

6.4 Claim Puts Nemotron-Labs Diffusion in AI Fast Lane

Nemotron-Labs Diffusion de NVIDIA busca acelerar las aplicaciones de IA abordando el cuello de botella de un token mediante la generación paralela de múltiples tokens. Este nuevo modelo de lenguaje de difusión afirma lograr hasta 6.4 veces más tokens por pasada directa, beneficiando significativamente a productos de IA sensibles a la latencia como asistentes de codificación y flujos de trabajo de agentes.

27
RESEARCHDEV.to AI·11/5/2026

AI/ML Research Digest — May 09, 2026

Este resumen de investigación en IA/ML cubre avances en modelos de difusión latente para generación multimodal, centrándose en la eficiencia y la extensión de las capacidades de imágenes a vídeo. También destaca innovaciones en el enrutamiento modular de expertos para redes neuronales y métodos de computación adaptativa para optimizar procesos de toma de decisiones secuenciales.

27
RESEARCHarXiv CS.LG·9/4/2026

$S^3$: Stratified Scaling Search for Test-Time in Diffusion Language Models

O trabalho propõe $S^3$ (Stratified Scaling Search), um método de busca guiado por verificador para melhorar a qualidade de geração em modelos de linguagem de difusão durante o tempo de inferência. Ele realoca a computação no processo de denoising, avaliando e reamostrando seletivamente candidatos promissores para favorecer saídas de maior qualidade.

27
RESEARCHarXiv CS.LG·1/5/2026

Simple Self-Conditioning Adaptation for Masked Diffusion Models

Los modelos de difusión enmascarada (MDM) descartan predicciones para tokens que permanecen enmascarados, lo que limita el refinamiento entre pasos. Este artículo propone los Modelos de Difusión Enmascarada Auto-Condicionados (SCMDM), una adaptación post-entrenamiento que condiciona cada paso de denoising en las predicciones de estado limpio anteriores del propio modelo. Esto mejora el rendimiento sin cambios arquitectónicos importantes ni evaluaciones adicionales.

27
RESEARCHarXiv CS.CL·8/5/2026

Chainwash: Multi-Step Rewriting Attacks on Diffusion Language Model Watermarks

Este estudio investiga ataques de reescritura de varios pasos contra marcas de agua en modelos de lenguaje de difusión, utilizados para verificar la autoría de texto por IA. Los hallazgos demuestran que los textos con marcas de agua pueden ver su detección comprometida después de múltiples reescrituras por otros modelos de lenguaje, incluso sin conocer la clave de la marca de agua.

27
RESEARCHarXiv CS.LG·hace 26d

Beyond Mode-Seeking RL: Trajectory-Balance Post-Training for Diffusion Language Models

Este artículo presenta TraFL, un nuevo enfoque de post-entrenamiento para modelos de lenguaje de difusión que aborda el "bloqueo de trayectoria" encontrado en métodos de maximización de recompensa. TraFL, un objetivo de equilibrio de trayectoria, supera a otros métodos en benchmarks de razonamiento matemático y generación de código.

27
RESEARCHarXiv CS.LG·11/5/2026

Conditional generation of antibody sequences with classifier-guided germline-absorbing discrete diffusion

Esta investigación presenta un enfoque novedoso para la generación condicional de secuencias de anticuerpos, abordando las limitaciones de los modelos de lenguaje de proteínas actuales al modelar mejor la variación somática y permitir la generación condicional guiada por clasificadores. Propone el ajuste fino por difusión discreta y la difusión absorbente de la línea germinal para mejorar el diseño de anticuerpos.

27
RESEARCHarXiv CS.LG·hace 28d

TMPO: Trajectory Matching Policy Optimization for Diverse and Efficient Diffusion Alignment

Trajectory Matching Policy Optimization (TMPO) aborda el problema de la recompensa excesiva en el aprendizaje por refuerzo para modelos de difusión, que a menudo causa colapso de modo y degrada la diversidad generativa. Sustituye la maximización de la recompensa escalar por la coincidencia de la distribución de recompensa a nivel de trayectoria, utilizando un objetivo de Softmax Trajectory Balance para alinear las probabilidades de la política con una distribución de Boltzmann inducida por la recompensa.

27
RESEARCHarXiv CS.LG·hace 28d

LEAP: Unlocking dLLM Parallelism via Lookahead Early-Convergence Token Detection

Los Modelos de Lenguaje de Difusión (dLLMs) encuentran límites de escalabilidad en el paralelismo debido a umbrales de confianza excesivamente conservadores que restringen su potencial de procesamiento altamente paralelo. Este artículo introduce LEAP, un método plug-and-play sin entrenamiento que mejora el paralelismo de los dLLMs al detectar tokens de convergencia temprana, acelerando así la decodificación.

27
RESEARCHarXiv CS.AI·hace 12d

Orthogonal Concept Erasure for Diffusion Models

Este artículo de investigación examina las limitaciones de los métodos actuales de borrado de conceptos para mitigar contenido no deseado en modelos de difusión. Identifica que las actualizaciones de parámetros aditivos en métodos basados en edición provocan un entrelazamiento entre la semántica del concepto y la capacidad generativa general, proponiendo una nueva solución para mejorar la precisión y la preservación.

27
RESEARCHarXiv CS.LG·hace 7d

Geometry-Aware Tabular Diffusion

Se introduce Geometry-Aware Tabular Diffusion (GATD) para la síntesis tabular, mejorando los denoisers con ángulos y longitudes pareadas de las diferencias de valores de columna. Logra un rendimiento de vanguardia con menos parámetros, reduciendo errores y demostrando que la supervisión relacional explícita impulsa las ganancias.

27
RESEARCHarXiv CS.CL·hace 13d

ICG: Improving Cover Image Generation via MLLM-based Prompting and Personalized Preference Alignment

El artículo propone ICG, un nuevo marco para la generación personalizada de imágenes de portada que integra el prompting basado en MLLM con la alineación de preferencias. Utiliza características semánticas e incrustaciones de usuario para contextualizar el modelo de difusión y adopta una estrategia de aprendizaje de recompensas múltiples para abordar la falta de supervisión etiquetada.

27
RESEARCHDEV.to AI·4/5/2026

Learning to Efficiently Sample from Diffusion Probabilistic Models

Esta investigación se centra en desarrollar métodos más eficientes para el muestreo de Modelos Probabilísticos de Difusión, con el objetivo de reducir el costo computacional y el tiempo asociados a la generación de muestras de alta calidad. Explora nuevos algoritmos para acelerar el proceso de muestreo manteniendo la fidelidad de los datos generados.

27