Diffusion Models

41 items

RESEARCHarXiv CS.CL·il y a 27j

Differences in Text Generated by Diffusion and Autoregressive Language Models

Cette recherche explore les différences intrinsèques dans le texte généré par les Modèles de Langage à Diffusion (DLM) et les Modèles de Langage Autorégressifs (ARM), constatant que les DLM présentent une entropie n-gramme inférieure mais une cohérence et une diversité sémantiques plus élevées. Des expériences contrôlées révèlent que les objectifs d'entraînement des DLM améliorent la cohérence et la diversité grâce au contexte bidirectionnel, tandis que les algorithmes de décodage sont responsables de la réduction de l'entropie.

Diffusion Models language models NLP text generation

ARTICLEDEV.to AI·11/05/2026

Before the image knows what it is

Le texte explore le bref moment, lors de la génération d'images par des modèles de diffusion, où le bruit s'organise en intention avant de prendre forme. Ce moment de latence est l'endroit où réside l'art, avant que l'image ne se définisse.

Diffusion Models creativity AI art Generative AI

NEWSDEV.to AI·il y a 18j

6.4 Claim Puts Nemotron-Labs Diffusion in AI Fast Lane

Le Nemotron-Labs Diffusion de NVIDIA vise à accélérer les applications d'IA en s'attaquant au goulot d'étranglement d'un seul token grâce à la génération parallèle de multiples tokens. Ce nouveau modèle de langage de diffusion prétend atteindre jusqu'à 6,4 fois plus de tokens par passage avant, bénéficiant considérablement aux produits d'IA sensibles à la latence tels que les assistants de codage et les flux de travail d'agents.

Diffusion Models language models AI NVIDIA

RESEARCHHugging Face Blog·il y a 18j

Towards Speed-of-Light Text Generation with Nemotron-Labs Diffusion Language Models

Ce contenu aborde le développement de modèles de langage de diffusion de Nemotron-Labs visant à atteindre une génération de texte à une vitesse exceptionnellement élevée. L'accent est mis sur les avancées techniques pour optimiser la rapidité de la production textuelle.

Diffusion Models language models Nemotron-Labs text generation

NEWSDEV.to AI·il y a 9j

Bonsai Image 4B: difusión de 1 bit que corre en un iPhone

PrismML a lancé Bonsai Image 4B, une famille de modèles de génération d'images utilisant des poids 1 bit ou ternaires pour exécuter la diffusion de haute qualité sur des appareils locaux comme les iPhones. Cette innovation permet une compression du modèle de 8,3 fois, le réduisant de 7,75 Go à 0,93 Go, tout en conservant jusqu'à 95 % de la qualité d'origine.

Diffusion Models Edge AI image generation PrismML

RESEARCHDEV.to AI·il y a 20j

DualFashion: Dual-Diffusion Transformer Generates Outfit Images & Text

DualFashion est une architecture Transformer à double diffusion qui génère conjointement des images d'articles de mode et des descriptions textuelles. Il surpasse les méthodes de pointe sur les benchmarks iFashion et Polyvore-U pour la recommandation générative de tenues, fournissant des résultats interprétables.

Diffusion Models image generation text generation fashion AI

RESEARCHDEV.to AI·11/05/2026

AI/ML Research Digest — May 09, 2026

Ce résumé de recherche en IA/ML couvre les avancées des modèles de diffusion latente pour la génération multimodale, se concentrant sur l'efficacité et l'extension des capacités des images à la vidéo. Il met également en évidence les innovations en matière de routage modulaire d'experts pour les réseaux neuronaux et les méthodes de calcul adaptatif pour optimiser les processus de prise de décision séquentielle.

Diffusion Models multimodal AI LLM Agents machine learning

RESEARCHarXiv CS.LG·09/04/2026

$S^3$: Stratified Scaling Search for Test-Time in Diffusion Language Models

O trabalho propõe $S^3$ (Stratified Scaling Search), um método de busca guiado por verificador para melhorar a qualidade de geração em modelos de linguagem de difusão durante o tempo de inferência. Ele realoca a computação no processo de denoising, avaliando e reamostrando seletivamente candidatos promissores para favorecer saídas de maior qualidade.

Diffusion Models search algorithms language models inference

RESEARCHarXiv CS.LG·01/05/2026

Simple Self-Conditioning Adaptation for Masked Diffusion Models

Les modèles de diffusion masqués (MDMs) ignorent les prédictions d'état propre pour les jetons qui restent masqués, limitant le raffinement inter-étapes. Cet article propose les modèles de diffusion masqués auto-conditionnés (SCMDM), une adaptation post-entraînement qui conditionne chaque étape de débruitage sur les prédictions d'état propre précédentes du modèle lui-même. Cela améliore les performances sans changements architecturaux majeurs ni évaluations supplémentaires.

Diffusion Models model adaptation deep learning machine learning

RESEARCHarXiv CS.CL·08/05/2026

Chainwash: Multi-Step Rewriting Attacks on Diffusion Language Model Watermarks

Cette étude examine les attaques de réécriture multi-étapes sur les filigranes des modèles de langage à diffusion, qui servent à vérifier l'origine des textes générés par l'IA. Les résultats indiquent que les textes filigranés peuvent voir leur détection compromise après plusieurs réécritures par d'autres modèles de langage, même ceux qui ignorent la clé du filigrane.

Diffusion Models language models AI watermarking security

RESEARCHarXiv CS.CL·il y a 20j

FlowLM: Few-Step Language Modeling via Diffusion-to-Flow Adaptation

FlowLM introduit un nouveau modèle de langage de correspondance de flux, adapté des modèles de diffusion pré-entraînés via un réglage fin efficace. Cette méthode permet une génération de texte de haute qualité en quelques étapes, surpassant significativement l'échantillonnage par diffusion traditionnel avec moins d'époques d'entraînement.

Diffusion Models language models machine learning text generation

RESEARCHarXiv CS.LG·il y a 26j

Beyond Mode-Seeking RL: Trajectory-Balance Post-Training for Diffusion Language Models

Cet article présente TraFL, une nouvelle approche de post-entraînement pour les modèles de langage de diffusion qui s'attaque au "blocage de trajectoire" observé dans les méthodes de maximisation de récompense. TraFL, un objectif d'équilibre de trajectoire, surpasse les autres méthodes sur les benchmarks de raisonnement mathématique et de génération de code.

Diffusion Models language models reinforcement learning machine learning

RESEARCHarXiv CS.LG·11/05/2026

Conditional generation of antibody sequences with classifier-guided germline-absorbing discrete diffusion

Cette recherche introduit une nouvelle approche pour la génération conditionnelle de séquences d'anticorps, abordant les limites des modèles de langage de protéines actuels en modélisant mieux la variation somatique et en permettant une génération guidée par classificateur flexible. Elle propose le réglage fin par diffusion discrète et la diffusion absorbante de la lignée germinale pour améliorer la conception d'anticorps.

Antibody Design Diffusion Models computational biology protein language models

RESEARCHarXiv CS.LG·il y a 28j

TMPO: Trajectory Matching Policy Optimization for Diverse and Efficient Diffusion Alignment

Le Trajectory Matching Policy Optimization (TMPO) s'attaque au piratage des récompenses dans l'apprentissage par renforcement pour les modèles de diffusion, qui entraîne souvent un effondrement des modes et dégrade la diversité générative. Il remplace la maximisation de la récompense scalaire par l'appariement de la distribution de récompense au niveau de la trajectoire, en utilisant un objectif de Softmax Trajectory Balance pour aligner les probabilités de la politique avec une distribution de Boltzmann induite par la récompense.

Diffusion Models reinforcement learning AI alignment Generative AI

RESEARCHarXiv CS.LG·il y a 28j

LEAP: Unlocking dLLM Parallelism via Lookahead Early-Convergence Token Detection

Les Modèles de Langage de Diffusion (dLLMs) rencontrent des limites de scalabilité dans le parallélisme en raison de seuils de confiance excessivement conservateurs qui entravent leur potentiel de traitement hautement parallèle. Cet article présente LEAP, une méthode plug-and-play sans entraînement qui améliore le parallélisme des dLLMs en détectant les jetons à convergence précoce, accélérant ainsi le décodage.

Diffusion Models Parallel Computing AI large language models

RESEARCHarXiv CS.AI·il y a 12j

Orthogonal Concept Erasure for Diffusion Models

Cet article de recherche examine les limitations des méthodes actuelles d'effacement de concepts pour atténuer le contenu indésirable dans les modèles de diffusion. Il identifie que les mises à jour additives des paramètres dans les méthodes basées sur l'édition provoquent un enchevêtrement entre la sémantique des concepts et la capacité générative globale, proposant une nouvelle solution pour améliorer la précision et la préservation.

Diffusion Models machine learning Concept Erasure AI safety

RESEARCHarXiv CS.LG·il y a 7j

Geometry-Aware Tabular Diffusion

La diffusion tabulaire sensible à la géométrie (GATD) est introduite pour la synthèse tabulaire, améliorant les dénoiseurs avec des angles et des longueurs appariés issus des différences de valeurs de colonne. Elle atteint des performances de pointe avec moins de paramètres, réduisant les erreurs et démontrant que la supervision relationnelle explicite est la clé du gain.

Diffusion Models data synthesis deep learning machine learning

RESEARCHarXiv CS.CL·il y a 13j

ICG: Improving Cover Image Generation via MLLM-based Prompting and Personalized Preference Alignment

L'article propose ICG, un nouveau cadre pour la génération personnalisée d'images de couverture intégrant la sollicitation basée sur les MLLM avec l'alignement des préférences. Il utilise des caractéristiques sémantiques et des embeddings d'utilisateur pour contextualiser le modèle de diffusion et adopte une stratégie d'apprentissage multi-récompense pour pallier le manque de supervision étiquetée.

personalization Diffusion Models MLLMs image generation

RESEARCHDEV.to AI·04/05/2026

Learning to Efficiently Sample from Diffusion Probabilistic Models

Cette recherche se concentre sur le développement de méthodes plus efficaces pour l'échantillonnage à partir de modèles probabilistes de diffusion, visant à réduire le coût computationnel et le temps associés à la génération d'échantillons de haute qualité. Elle explore de nouveaux algorithmes pour accélérer le processus d'échantillonnage tout en maintenant la fidélité des données générées.

Diffusion Models generative models machine learning Sampling Efficiency

RESEARCHYannic Kilcher (YouTube)·27/12/2025

TiDAR: Think in Diffusion, Talk in Autoregression (Paper Analysis)

Ce contenu propose une analyse d'un article de recherche explorant le modèle TiDAR. Le modèle intègre des concepts de diffusion et d'autorégression pour le traitement.

Diffusion Models AI models Paper analysis Machine learning research

TiDAR: Think in Diffusion, Talk in Autoregression (Paper Analysis)