← heapsort-ai

Diffusion Models

41 items

RESEARCHarXiv CS.CL·il y a 27j

Differences in Text Generated by Diffusion and Autoregressive Language Models

Cette recherche explore les différences intrinsèques dans le texte généré par les Modèles de Langage à Diffusion (DLM) et les Modèles de Langage Autorégressifs (ARM), constatant que les DLM présentent une entropie n-gramme inférieure mais une cohérence et une diversité sémantiques plus élevées. Des expériences contrôlées révèlent que les objectifs d'entraînement des DLM améliorent la cohérence et la diversité grâce au contexte bidirectionnel, tandis que les algorithmes de décodage sont responsables de la réduction de l'entropie.

27
NEWSDEV.to AI·il y a 18j

6.4 Claim Puts Nemotron-Labs Diffusion in AI Fast Lane

Le Nemotron-Labs Diffusion de NVIDIA vise à accélérer les applications d'IA en s'attaquant au goulot d'étranglement d'un seul token grâce à la génération parallèle de multiples tokens. Ce nouveau modèle de langage de diffusion prétend atteindre jusqu'à 6,4 fois plus de tokens par passage avant, bénéficiant considérablement aux produits d'IA sensibles à la latence tels que les assistants de codage et les flux de travail d'agents.

27
NEWSDEV.to AI·il y a 9j

Bonsai Image 4B: difusión de 1 bit que corre en un iPhone

PrismML a lancé Bonsai Image 4B, une famille de modèles de génération d'images utilisant des poids 1 bit ou ternaires pour exécuter la diffusion de haute qualité sur des appareils locaux comme les iPhones. Cette innovation permet une compression du modèle de 8,3 fois, le réduisant de 7,75 Go à 0,93 Go, tout en conservant jusqu'à 95 % de la qualité d'origine.

27
RESEARCHDEV.to AI·11/05/2026

AI/ML Research Digest — May 09, 2026

Ce résumé de recherche en IA/ML couvre les avancées des modèles de diffusion latente pour la génération multimodale, se concentrant sur l'efficacité et l'extension des capacités des images à la vidéo. Il met également en évidence les innovations en matière de routage modulaire d'experts pour les réseaux neuronaux et les méthodes de calcul adaptatif pour optimiser les processus de prise de décision séquentielle.

27
RESEARCHarXiv CS.LG·09/04/2026

$S^3$: Stratified Scaling Search for Test-Time in Diffusion Language Models

O trabalho propõe $S^3$ (Stratified Scaling Search), um método de busca guiado por verificador para melhorar a qualidade de geração em modelos de linguagem de difusão durante o tempo de inferência. Ele realoca a computação no processo de denoising, avaliando e reamostrando seletivamente candidatos promissores para favorecer saídas de maior qualidade.

27
RESEARCHarXiv CS.LG·01/05/2026

Simple Self-Conditioning Adaptation for Masked Diffusion Models

Les modèles de diffusion masqués (MDMs) ignorent les prédictions d'état propre pour les jetons qui restent masqués, limitant le raffinement inter-étapes. Cet article propose les modèles de diffusion masqués auto-conditionnés (SCMDM), une adaptation post-entraînement qui conditionne chaque étape de débruitage sur les prédictions d'état propre précédentes du modèle lui-même. Cela améliore les performances sans changements architecturaux majeurs ni évaluations supplémentaires.

27
RESEARCHarXiv CS.CL·08/05/2026

Chainwash: Multi-Step Rewriting Attacks on Diffusion Language Model Watermarks

Cette étude examine les attaques de réécriture multi-étapes sur les filigranes des modèles de langage à diffusion, qui servent à vérifier l'origine des textes générés par l'IA. Les résultats indiquent que les textes filigranés peuvent voir leur détection compromise après plusieurs réécritures par d'autres modèles de langage, même ceux qui ignorent la clé du filigrane.

27
RESEARCHarXiv CS.CL·il y a 20j

FlowLM: Few-Step Language Modeling via Diffusion-to-Flow Adaptation

FlowLM introduit un nouveau modèle de langage de correspondance de flux, adapté des modèles de diffusion pré-entraînés via un réglage fin efficace. Cette méthode permet une génération de texte de haute qualité en quelques étapes, surpassant significativement l'échantillonnage par diffusion traditionnel avec moins d'époques d'entraînement.

27
RESEARCHarXiv CS.LG·il y a 26j

Beyond Mode-Seeking RL: Trajectory-Balance Post-Training for Diffusion Language Models

Cet article présente TraFL, une nouvelle approche de post-entraînement pour les modèles de langage de diffusion qui s'attaque au "blocage de trajectoire" observé dans les méthodes de maximisation de récompense. TraFL, un objectif d'équilibre de trajectoire, surpasse les autres méthodes sur les benchmarks de raisonnement mathématique et de génération de code.

27
RESEARCHarXiv CS.LG·11/05/2026

Conditional generation of antibody sequences with classifier-guided germline-absorbing discrete diffusion

Cette recherche introduit une nouvelle approche pour la génération conditionnelle de séquences d'anticorps, abordant les limites des modèles de langage de protéines actuels en modélisant mieux la variation somatique et en permettant une génération guidée par classificateur flexible. Elle propose le réglage fin par diffusion discrète et la diffusion absorbante de la lignée germinale pour améliorer la conception d'anticorps.

27
RESEARCHarXiv CS.LG·il y a 28j

TMPO: Trajectory Matching Policy Optimization for Diverse and Efficient Diffusion Alignment

Le Trajectory Matching Policy Optimization (TMPO) s'attaque au piratage des récompenses dans l'apprentissage par renforcement pour les modèles de diffusion, qui entraîne souvent un effondrement des modes et dégrade la diversité générative. Il remplace la maximisation de la récompense scalaire par l'appariement de la distribution de récompense au niveau de la trajectoire, en utilisant un objectif de Softmax Trajectory Balance pour aligner les probabilités de la politique avec une distribution de Boltzmann induite par la récompense.

27
RESEARCHarXiv CS.LG·il y a 28j

LEAP: Unlocking dLLM Parallelism via Lookahead Early-Convergence Token Detection

Les Modèles de Langage de Diffusion (dLLMs) rencontrent des limites de scalabilité dans le parallélisme en raison de seuils de confiance excessivement conservateurs qui entravent leur potentiel de traitement hautement parallèle. Cet article présente LEAP, une méthode plug-and-play sans entraînement qui améliore le parallélisme des dLLMs en détectant les jetons à convergence précoce, accélérant ainsi le décodage.

27
RESEARCHarXiv CS.AI·il y a 12j

Orthogonal Concept Erasure for Diffusion Models

Cet article de recherche examine les limitations des méthodes actuelles d'effacement de concepts pour atténuer le contenu indésirable dans les modèles de diffusion. Il identifie que les mises à jour additives des paramètres dans les méthodes basées sur l'édition provoquent un enchevêtrement entre la sémantique des concepts et la capacité générative globale, proposant une nouvelle solution pour améliorer la précision et la préservation.

27
RESEARCHarXiv CS.LG·il y a 7j

Geometry-Aware Tabular Diffusion

La diffusion tabulaire sensible à la géométrie (GATD) est introduite pour la synthèse tabulaire, améliorant les dénoiseurs avec des angles et des longueurs appariés issus des différences de valeurs de colonne. Elle atteint des performances de pointe avec moins de paramètres, réduisant les erreurs et démontrant que la supervision relationnelle explicite est la clé du gain.

27
RESEARCHarXiv CS.CL·il y a 13j

ICG: Improving Cover Image Generation via MLLM-based Prompting and Personalized Preference Alignment

L'article propose ICG, un nouveau cadre pour la génération personnalisée d'images de couverture intégrant la sollicitation basée sur les MLLM avec l'alignement des préférences. Il utilise des caractéristiques sémantiques et des embeddings d'utilisateur pour contextualiser le modèle de diffusion et adopte une stratégie d'apprentissage multi-récompense pour pallier le manque de supervision étiquetée.

27
RESEARCHDEV.to AI·04/05/2026

Learning to Efficiently Sample from Diffusion Probabilistic Models

Cette recherche se concentre sur le développement de méthodes plus efficaces pour l'échantillonnage à partir de modèles probabilistes de diffusion, visant à réduire le coût computationnel et le temps associés à la génération d'échantillons de haute qualité. Elle explore de nouveaux algorithmes pour accélérer le processus d'échantillonnage tout en maintenant la fidélité des données générées.

27