text generation

16 items

ARTICLE↑ trendingReddit r/LocalLLaMA·vor 27T

TextGen is now a native desktop app. Open-source alternative to LM Studio (formerly text-generation-webui).

TextGen, eine Open-Source-Alternative zu LM Studio, hat sich zu einer installationsfreien Desktop-Anwendung für Windows, Linux und macOS entwickelt. Seit Dezember 2022 in Entwicklung, bietet diese eigenständige App eine polierte Benutzeroberfläche für die Textgenerierung und funktioniert ähnlich wie LM Studio mit Electron.

desktop app Open Source LLMs text generation

TextGen is now a native desktop app. Open-source alternative to LM Studio (formerly text-generation-webui).

RESEARCHarXiv CS.CL·4/6/2026

Dependency-Guided Parallel Decoding in Discrete Diffusion Language Models

Modelos de linguagem de difusão discreta (dLLMs) aceleram a geração de texto, mas a decodificação paralela degrada a qualidade ao desconsiderar a dependência entre tokens. DEMASK propõe um preditor leve que estima influências condicionais para guiar o desmascaramento simultâneo, comprovadamente melhorando a qualidade. A técnica resulta em um ganho de velocidade de 1.7 a 2.2x, mantendo ou superando o desempenho.

Dependency Prediction DEMASK Parallel Decoding machine learning

RESEARCHarXiv CS.LG·vor 27T

Steering Without Breaking: Mechanistically Informed Interventions for Discrete Diffusion Language Models

Diese Arbeit untersucht die Einschränkungen gleichmäßiger Interventionen in diskreten Diffusions-Sprachmodellen (DLMs) und zeigt, dass diese die Qualität der gesteuerten Generierung verschlechtern. Die Autoren stellen fest, dass verschiedene Attribute zu unterschiedlichen Zeitpunkten im Denoising-Prozess fixiert werden, und schlagen einen adaptiven Planer vor, um Interventionen effizient zu konzentrieren.

Diffusion Models language models Controlled Generation text generation

RESEARCHarXiv CS.CL·vor 12T

From AR to Diffusion: Efficiently Adapting Large Language Models with Strictly Causal and Elastic Horizons

FLUID ist ein neues Framework, das autoregressive (AR) Backbones effizient an das Diffusionsparadigma zur parallelen Textgenerierung anpasst. Es ermöglicht die Initialisierung von GPT-Modellen und führt einen dynamischen Entrauschungsmechanismus ein, wodurch Spitzenleistungen bei erheblich reduzierten Trainingskosten erzielt werden.

Diffusion Models text generation large language models Autoregressive Models

RESEARCHarXiv CS.CL·4/6/2026

Pragmatics Meets Culture: Culturally-adapted Artwork Description Generation and Evaluation

Este artigo apresenta a tarefa de geração de descrições de arte culturalmente adaptadas para combater o viés cultural em modelos de linguagem na geração de texto aberto. Ele propõe um framework de avaliação baseado em perguntas e respostas culturalmente fundamentadas, mostrando que um modelo de locutor pragmático melhora significativamente a compreensão do ouvinte.

Art Description language models evaluation Pragmatics

RESEARCHarXiv CS.CL·vor 26T

Differences in Text Generated by Diffusion and Autoregressive Language Models

Diese Forschung untersucht die intrinsischen Unterschiede in Texten, die von Diffusions-Sprachmodellen (DLMs) und autoregressiven Sprachmodellen (ARMs) generiert werden, und stellt fest, dass DLMs eine geringere n-Gramm-Entropie, aber eine höhere semantische Kohärenz und Diversität aufweisen. Kontrollierte Experimente zeigen, dass die Trainingsziele von DLMs zur Erhöhung der semantischen Kohärenz und Diversität beitragen, während die Dekodierungsalgorithmen für die Entropiereduktion verantwortlich sind.

Diffusion Models language models NLP text generation

DOCML Mastery·vor 13T

The Statistics of Token Selection: Logits, Temperature, and Top-P Walkthrough

Dieser Inhalt erläutert den Prozess der Token-Auswahl in großen Sprachmodellen (LLMs). Er beschreibt detailliert, wie Kriterien wie Logits, Temperatur und Top-P die Kohärenz und Kreativität der generierten Ausgaben beeinflussen.

LLMs Token Selection deep learning machine learning

The Statistics of Token Selection: Logits, Temperature, and Top-P Walkthrough

RESEARCHHugging Face Blog·vor 18T

Towards Speed-of-Light Text Generation with Nemotron-Labs Diffusion Language Models

Dieser Inhalt behandelt die Entwicklung von Nemotron-Labs' Diffusions-Sprachmodellen zur Erzeugung von Text mit außergewöhnlich hoher Geschwindigkeit. Der Fokus liegt auf technischen Fortschritten zur Optimierung der Geschwindigkeit der Textproduktion.

Diffusion Models language models Nemotron-Labs text generation

ARTICLEDEV.to AI·vor 13T

Meet EAGLE 3.1: A Friendly Fix for AI's Attention Issues

EAGLE 3.1 ist ein innovatives Tool, das entwickelt wurde, um KI dabei zu helfen, den Fokus in Gesprächen und bei der Texterzeugung zu behalten, indem es das Problem der "Aufmerksamkeitsdrift" in LLMs bekämpft. Dieses Phänomen kann dazu führen, dass KI-Antworten weniger kohärent werden, ähnlich dem Verlust der Konzentration beim Lesen eines Buches.

Attention Mechanism text generation EAGLE 3.1 AI

RESEARCHarXiv CS.CL·4/7/2026

Noise Steering for Controlled Text Generation: Improving Diversity and Reading-Level Fidelity in Arabic Educational Story Generation

O artigo investiga a técnica de "noise steering", que injeta perturbações gaussianas em modelos Transformer durante a inferência, para gerar histórias educacionais em árabe. O método melhora a diversidade narrativa para avaliações de leitura de nível inicial, mantendo a qualidade e o nível de leitura.

Noise Steering NLP Diversity text generation Transformer Models

RESEARCHDEV.to AI·vor 20T

DualFashion: Dual-Diffusion Transformer Generates Outfit Images & Text

DualFashion ist eine Dual-Diffusion-Transformer-Architektur, die gemeinsam Modebilder und Textbeschreibungen generiert. Es übertrifft modernste Methoden auf den iFashion- und Polyvore-U-Benchmarks für generative Outfit-Empfehlungen und liefert interpretierbare Ausgaben.

Diffusion Models image generation text generation fashion AI

RESEARCHarXiv CS.CL·5/8/2026

Chainwash: Multi-Step Rewriting Attacks on Diffusion Language Model Watermarks

Diese Studie untersucht mehrstufige Umschreibungsangriffe auf Wasserzeichen von Diffusions-Sprachmodellen, die zur Überprüfung der KI-Textherkunft verwendet werden. Die Ergebnisse zeigen, dass wasserzeichenversehene Texte nach mehrfachem Umschreiben durch andere Sprachmodelle, selbst ohne Kenntnis des Wasserzeichenschlüssels, ihre Erkennung beeinträchtigen können.

Diffusion Models language models AI watermarking security

RESEARCHarXiv CS.CL·vor 19T

FlowLM: Few-Step Language Modeling via Diffusion-to-Flow Adaptation

FlowLM stellt ein neues Fluss-Matching-Sprachmodell vor, das aus vortrainierten Diffusionssprachmodellen durch effizientes Fine-Tuning transformiert wurde. Diese Methode ermöglicht eine hochwertige Textgenerierung in wenigen Schritten, die die Qualität der traditionellen Diffusionsabtastung mit weniger Trainingsepochen deutlich übertrifft.

Diffusion Models language models machine learning text generation

RESEARCHarXiv CS.CL·vor 7T

AEyeDE: An Attention-Based Attribution Framework for AI-Generated Text Detection

Dieses Papier stellt AEyeDE vor, einen auf Aufmerksamkeit basierenden Ansatz zur Erkennung von menschlicher und KI-Autorenschaft, der die Modellaufmerksamkeit als diskriminierendes Signal nutzt. Die Methode übertrifft Text-only-Baselines durchweg und zeigt Robustheit in verschiedenen Textgenerierungseinstellungen, wobei sie auf Standard-Benchmarks wettbewerbsfähig bleibt.

AI detection machine learning NLP attention mechanisms

DOCDEV.to AI·vor 14T

How LLMs Actually Work — From Tokens to Text (with Python)

Dieser Inhalt erklärt den grundlegenden Mechanismus von großen Sprachmodellen (LLMs) wie ChatGPT und detailliert, wie sie das nächste Token vorhersagen, um Text zu generieren. Er beschreibt die Pipeline von der Tokenisierung und Vektorrepräsentation über Aufmerksamkeitsmechanismen bis hin zum iterativen Prozess der Textgenerierung.

learning text generation Python Tokenization

ARTICLEDEV.to AI·4/22/2026

AI-genererade texter: Hur plagiatkontroll upptäcker dem

KI-Tools haben die Texterstellung revolutioniert und erschweren die Unterscheidung zwischen menschlich verfassten und KI-generierten Inhalten. Moderne Plagiatskontrollsysteme entwickeln sich weiter, um KI-generierte Texte zu erkennen und die Inhaltsauthentizität durch die Analyse von Sprachmodellen, die Wörter probabilistisch vorhersagen, zu gewährleisten.

language models plagiarism text generation content authenticity