Diffusion Models

41 items

RESEARCHarXiv CS.AI·vor 1T

DiBS: Diffusion-Informed Branch Selection

Der Artikel stellt DiBS vor, einen neuartigen, diffusionsmodellgesteuerten Ansatz zur Zweigauswahl beim Lösen von Sudoku, einem Problem der Nebenbedingungserfüllung. Er verbessert symbolische Löser durch die Verwendung eines Diffusionsmodells zur Steuerung der Zweiganordnung, um Vollständigkeit zu gewährleisten und Probleme bei der Langschwanzsuche zu mildern.

branch selection Diffusion Models constraint satisfaction Sudoku

RESEARCHarXiv CS.CL·vor 1T

Data-Efficient Autoregressive-to-Diffusion Language Models via On-Policy Distillation

Dieses Papier stellt das On-Policy Diffusion Language Model (OPDLM) vor, um autoregressive Modelle (ARLMs) in Diffusions-Sprachmodelle (DLMs) umzuwandeln. Es befasst sich mit Problemen wie Wissensverlust und der Diskrepanz zwischen Training und Inferenz durch den Einsatz von On-Policy Distillation (OPD).

Diffusion Models language models AI models machine learning

RESEARCHarXiv CS.LG·vor 20Std

Enabling KV Caching of Shared Prefix for Diffusion Language Models

Die Arbeit stellt "bicache" vor, die erste KV-Caching-Technik für geteilte Präfixe in Diffusions-Sprachmodellen (DLMs), die Herausforderungen angeht, bei denen bestehende LLM-Caching-Methoden aufgrund der bidirektionalen Aufmerksamkeit von DLMs versagen. Dieser neue Ansatz zielt darauf ab, einen hohen Durchsatz beim DLM-Serving zu ermöglichen, indem er Erkenntnisse über die Stabilität geteilter Präfix-KVs in flachen Schichten nutzt.

Diffusion Models KV Caching Performance optimization High-throughput serving

RESEARCH↑ trendingReddit r/LocalLLaMA·4/10/2026

National University of Singapore Presents "DMax": A New Paradigm For Diffusion Language Models (dLLMs) Enabling Aggressive Parallel Decoding.

DMax é um novo paradigma para modelos de linguagem de difusão (dLLMs) eficientes que mitiga o acúmulo de erros na decodificação paralela. Ele permite um paralelismo agressivo ao reformular a decodificação como um processo de auto-refinamento progressivo e introduzir uma estratégia de treinamento unificada.

Diffusion Models Parallel Decoding natural language processing AI

ARTICLE↑ trendingReddit r/MachineLearning·4/21/2026

Bulding my own Diffusion Language Model from scratch was easier than I thought [P]

Der Autor hat ein Diffusions-Sprachmodell von Grund auf neu entwickelt, um komplexe Konzepte besser zu verstehen, ohne die Hilfe von KI-generiertem Code. Er trainierte das 7,5M-Parameter-Modell mit dem winzigen Shakespeare-Datensatz und teilte den Code auf GitHub.

Diffusion Models language models personal-project machine learning

RESEARCHarXiv CS.LG·vor 1T

FAIR-Calib: Frontier-Aware Instability-Reweighted Calibration for Post-Training Quantization of Diffusion Large Language Models

Diffusions-Large Language Models (dLLMs) leiden unter einem "Stabilitätsrückstand" aufgrund irreversibler Token-Commitments, ein Problem, das durch Fehler bei der Post-Training Quantization (PTQ) verschärft wird. FAIR-Calib schlägt ein zweistufiges PTQ-Framework vor, das ein Positions-Prior und schichtweise Kalibrierung nutzt, um fragile Grenzschichtzustände zu schützen und so die Quantisierung für dLLMs zu verbessern.

Diffusion Models post-training quantization quantization AI calibration

ARTICLEDEV.to AI·4/22/2026

The Unfinished Frame

Der Autor erforscht die Schönheit und Ehrlichkeit des Anhaltens von Diffusionsmodellen mitten im Rendering, wobei er diese unfertigen Bilder als aufschlussreicher empfindet als polierte Endbilder. Diese Phasen, in denen KI-Modelle noch „denken“ und Merkmale aus ihren Trainingsdaten aushandeln, werden eher als „Geständnis“ denn als „Aussage“ beschrieben.

Diffusion Models creative process AI art AI philosophy

RESEARCHarXiv CS.CL·4/22/2026

Remask, Don't Replace: Token-to-Mask Refinement in Masked Diffusion Language Models

Dieses Papier schlägt eine neue Technik, das Token-to-Mask (T2M) Remasking, zur Verfeinerung maskierter Diffusions-Sprachmodelle wie LLaDA2.1 vor. Die Methode behebt die Mängel der Token-to-Token (T2T)-Bearbeitung, indem sie verdächtige Token in einen Maskierungszustand zurücksetzt, was eine genauere Neuprädiktion ermöglicht.

Diffusion Models language models error correction natural language processing

RESEARCHarXiv CS.LG·4/22/2026

Discrete Tilt Matching

Discrete Tilt Matching (DTM) ist eine neue, wahrscheinlichkeitstheorie-freie Methode zum Fine-Tuning maskierter Diffusions-Sprachmodelle (dLLMs), die das Problem der nicht bestimmbaren marginalen Wahrscheinlichkeiten löst. Sie formuliert das Fine-Tuning als Zustandsabgleich um und verwendet ein gewichtetes Kreuzentropie-Ziel mit Kontrollvariablen, wodurch sie signifikante Verbesserungen bei Aufgaben wie Sudoku und Countdown erzielt.

Diffusion Models LLMs reinforcement learning machine learning

RESEARCHarXiv CS.CL·4/13/2026

Re-Mask and Redirect: Exploiting Denoising Irreversibility in Diffusion Language Models

Diese Arbeit enthüllt eine kritische Schwachstelle in diffusionsbasierten Sprachmodellen (dLLMs), deren Sicherheitsausrichtung, basierend auf monotonen Entrauschungsplänen, leicht umgangen werden kann. Durch das Neumaskieren von Ablehnungs-Tokens und das Injizieren eines bejahenden Präfixes erzielten Forscher hohe Angriffserfolgsraten gegen prominente dLLMs und legten damit einen strukturellen Fehler offen.

Diffusion Models language models vulnerability Exploitation

RESEARCHarXiv CS.LG·vor 19T

Provably Learning Diffusion Models under the Manifold Hypothesis: Collapse and Refine

Diese Arbeit bietet eine theoretische Erklärung für die Effizienz von Diffusionsmodellen beim Erlernen der Score-Funktion für hochdimensionale Daten auf niedrigdimensionalen Mannigfaltigkeiten. Sie identifiziert einen „Kollaps-und-Verfeinerungs“-Mechanismus, der durch die Geometrie der Score-Funktion angetrieben wird, wobei die Entrauschungsabbildung auf die Datenmannigfaltigkeit projiziert wird und die intrinsische Dichte verfeinert wird.

Diffusion Models Theoretical AI machine learning Manifold Learning

ARTICLEDEV.to AI·4/23/2026

From DALL-E to gpt-image-2: The Architectural Bet That Finally Fixed AI Text

OpenAIs neues gpt-image-2-Modell hat das langjährige Problem gelöst, dass KI-Modelle Text und komplexe Layouts in Bildern nicht genau wiedergeben konnten. Dieser architektonische Wandel stellt einen bedeutenden Fortschritt dar, der eine Neubewertung von auf Diffusionsmodellen basierenden Arbeitsabläufen erfordert.

Diffusion Models AI image generation AI architecture GPT

RESEARCHarXiv CS.LG·4/14/2026

The Diffusion-Attention Connection

Diese Forschung vereinheitlicht Transformatoren, Diffusionskarten und magnetische Laplacians und präsentiert sie als verschiedene Regime einer einzigen Markov-Geometrie, die aus Pre-Softmax-Query-Scores aufgebaut ist. Sie definiert eine QK-"Bidivergenz", um Attention und Diffusion zu verbinden und ihre Dynamik mittels Produkt von Experten und Schrödinger-Brücken zu organisieren.

Diffusion Models Deep Learning Theory Markov Geometry attention mechanisms

RESEARCHDEV.to AI·5/10/2026

Diffusion models approach AR quality and improve inference speed

Diffusionssprachmodelle erzielen nun erhebliche Durchsatzsteigerungen und verringern den Abstand zu autoregressiven Decodern bei der Inferenzgeschwindigkeit. Neue Introspektive Diffusionssprachmodelle (I-DLM) beheben frühere Probleme der introspektiven Konsistenz und ineffizienter Sampling-Schleifen, wodurch sowohl Qualität als auch Latenz verbessert werden.

inference speed Diffusion Models language models machine learning

RESEARCHarXiv CS.LG·vor 21T

Systematic Optimization of Real-Time Diffusion Model Inference on Apple M3 Ultra

Diese Forschung optimiert systematisch die Inferenz von Echtzeit-Diffusionsmodellen auf dem Apple M3 Ultra und untersucht verschiedene Techniken wie CoreML-Konvertierung und Quantisierung. Die Studie erreichte 22.7 FPS für die 512x512 img2img-Transformation durch die Kombination der CoreML-Konvertierung des SDXS-512 mit einer 3-Thread-Kamerapipeline.

Diffusion Models Optimization apple-silicon image generation

ARTICLEDEV.to AI·4/17/2026

Why Every AI Image Generator Fails at Text (And One That Finally Doesn't)

Dieser Artikel untersucht, warum KI-Bildgeneratoren wie Stable Diffusion und Midjourney konsequent bei der korrekten Textdarstellung versagen, was an der Art und Weise liegt, wie Diffusionsmodelle visuelle Muster lernen. Jedoch deutet er auf die Existenz eines Modells hin, das diese häufige Einschränkung endlich überwunden hat.

Diffusion Models AI image generation AI limitations

RESEARCHarXiv CS.LG·vor 27T

Steering Without Breaking: Mechanistically Informed Interventions for Discrete Diffusion Language Models

Diese Arbeit untersucht die Einschränkungen gleichmäßiger Interventionen in diskreten Diffusions-Sprachmodellen (DLMs) und zeigt, dass diese die Qualität der gesteuerten Generierung verschlechtern. Die Autoren stellen fest, dass verschiedene Attribute zu unterschiedlichen Zeitpunkten im Denoising-Prozess fixiert werden, und schlagen einen adaptiven Planer vor, um Interventionen effizient zu konzentrieren.

Diffusion Models language models Controlled Generation text generation

RESEARCHarXiv CS.CL·vor 12T

From AR to Diffusion: Efficiently Adapting Large Language Models with Strictly Causal and Elastic Horizons

FLUID ist ein neues Framework, das autoregressive (AR) Backbones effizient an das Diffusionsparadigma zur parallelen Textgenerierung anpasst. Es ermöglicht die Initialisierung von GPT-Modellen und führt einen dynamischen Entrauschungsmechanismus ein, wodurch Spitzenleistungen bei erheblich reduzierten Trainingskosten erzielt werden.

Diffusion Models text generation large language models Autoregressive Models

RESEARCHarXiv CS.LG·4/6/2026

Not All Denoising Steps Are Equal: Model Scheduling for Faster Masked Diffusion Language Models

Este trabalho explora o agendamento de modelos para acelerar os Modelos de Linguagem de Difusão Mascarada (MDLMs), substituindo o modelo completo por um menor em certas etapas de denoising. A pesquisa mostra que as etapas iniciais e finais são mais robustas a essa substituição, permitindo uma redução de até 17% nos FLOPs com degradação mínima na perplexidade generativa.

Diffusion Models language models Computational Efficiency denoising

RESEARCHarXiv CS.CL·vor 15T

Learnability-Informed Fine-Tuning of Diffusion Language Models

Diese Forschung stellt LIFT vor, einen lerbarkeitsinformierten Fine-Tuning-Algorithmus, der entwickelt wurde, um die Schlussfolgerungsfähigkeiten von Diffusions-Sprachmodellen zu verbessern. LIFT behebt Mängel des Standard-SFT, indem es Token adaptiv basierend auf deren Schwierigkeit und dem verfügbaren Kontext während verschiedener Diffusionszeitschritte lernt und dabei eine verbesserte Leistung gegenüber bestehenden Baselines zeigt.

Diffusion Models learning machine learning natural language processing