← heapsort-ai

text generation

16 items

ARTICLE↑ trendingReddit r/LocalLLaMA·vor 27T

TextGen is now a native desktop app. Open-source alternative to LM Studio (formerly text-generation-webui).

TextGen, eine Open-Source-Alternative zu LM Studio, hat sich zu einer installationsfreien Desktop-Anwendung für Windows, Linux und macOS entwickelt. Seit Dezember 2022 in Entwicklung, bietet diese eigenständige App eine polierte Benutzeroberfläche für die Textgenerierung und funktioniert ähnlich wie LM Studio mit Electron.

TextGen is now a native desktop app. Open-source alternative to LM Studio (formerly text-generation-webui).
42
RESEARCHarXiv CS.CL·4/6/2026

Dependency-Guided Parallel Decoding in Discrete Diffusion Language Models

Modelos de linguagem de difusão discreta (dLLMs) aceleram a geração de texto, mas a decodificação paralela degrada a qualidade ao desconsiderar a dependência entre tokens. DEMASK propõe um preditor leve que estima influências condicionais para guiar o desmascaramento simultâneo, comprovadamente melhorando a qualidade. A técnica resulta em um ganho de velocidade de 1.7 a 2.2x, mantendo ou superando o desempenho.

29
RESEARCHarXiv CS.LG·vor 27T

Steering Without Breaking: Mechanistically Informed Interventions for Discrete Diffusion Language Models

Diese Arbeit untersucht die Einschränkungen gleichmäßiger Interventionen in diskreten Diffusions-Sprachmodellen (DLMs) und zeigt, dass diese die Qualität der gesteuerten Generierung verschlechtern. Die Autoren stellen fest, dass verschiedene Attribute zu unterschiedlichen Zeitpunkten im Denoising-Prozess fixiert werden, und schlagen einen adaptiven Planer vor, um Interventionen effizient zu konzentrieren.

28
RESEARCHarXiv CS.CL·vor 12T

From AR to Diffusion: Efficiently Adapting Large Language Models with Strictly Causal and Elastic Horizons

FLUID ist ein neues Framework, das autoregressive (AR) Backbones effizient an das Diffusionsparadigma zur parallelen Textgenerierung anpasst. Es ermöglicht die Initialisierung von GPT-Modellen und führt einen dynamischen Entrauschungsmechanismus ein, wodurch Spitzenleistungen bei erheblich reduzierten Trainingskosten erzielt werden.

28
RESEARCHarXiv CS.CL·4/6/2026

Pragmatics Meets Culture: Culturally-adapted Artwork Description Generation and Evaluation

Este artigo apresenta a tarefa de geração de descrições de arte culturalmente adaptadas para combater o viés cultural em modelos de linguagem na geração de texto aberto. Ele propõe um framework de avaliação baseado em perguntas e respostas culturalmente fundamentadas, mostrando que um modelo de locutor pragmático melhora significativamente a compreensão do ouvinte.

28
RESEARCHarXiv CS.CL·vor 26T

Differences in Text Generated by Diffusion and Autoregressive Language Models

Diese Forschung untersucht die intrinsischen Unterschiede in Texten, die von Diffusions-Sprachmodellen (DLMs) und autoregressiven Sprachmodellen (ARMs) generiert werden, und stellt fest, dass DLMs eine geringere n-Gramm-Entropie, aber eine höhere semantische Kohärenz und Diversität aufweisen. Kontrollierte Experimente zeigen, dass die Trainingsziele von DLMs zur Erhöhung der semantischen Kohärenz und Diversität beitragen, während die Dekodierungsalgorithmen für die Entropiereduktion verantwortlich sind.

27
RESEARCHarXiv CS.CL·4/7/2026

Noise Steering for Controlled Text Generation: Improving Diversity and Reading-Level Fidelity in Arabic Educational Story Generation

O artigo investiga a técnica de "noise steering", que injeta perturbações gaussianas em modelos Transformer durante a inferência, para gerar histórias educacionais em árabe. O método melhora a diversidade narrativa para avaliações de leitura de nível inicial, mantendo a qualidade e o nível de leitura.

27
RESEARCHarXiv CS.CL·5/8/2026

Chainwash: Multi-Step Rewriting Attacks on Diffusion Language Model Watermarks

Diese Studie untersucht mehrstufige Umschreibungsangriffe auf Wasserzeichen von Diffusions-Sprachmodellen, die zur Überprüfung der KI-Textherkunft verwendet werden. Die Ergebnisse zeigen, dass wasserzeichenversehene Texte nach mehrfachem Umschreiben durch andere Sprachmodelle, selbst ohne Kenntnis des Wasserzeichenschlüssels, ihre Erkennung beeinträchtigen können.

27
RESEARCHarXiv CS.CL·vor 19T

FlowLM: Few-Step Language Modeling via Diffusion-to-Flow Adaptation

FlowLM stellt ein neues Fluss-Matching-Sprachmodell vor, das aus vortrainierten Diffusionssprachmodellen durch effizientes Fine-Tuning transformiert wurde. Diese Methode ermöglicht eine hochwertige Textgenerierung in wenigen Schritten, die die Qualität der traditionellen Diffusionsabtastung mit weniger Trainingsepochen deutlich übertrifft.

27
RESEARCHarXiv CS.CL·vor 7T

AEyeDE: An Attention-Based Attribution Framework for AI-Generated Text Detection

Dieses Papier stellt AEyeDE vor, einen auf Aufmerksamkeit basierenden Ansatz zur Erkennung von menschlicher und KI-Autorenschaft, der die Modellaufmerksamkeit als diskriminierendes Signal nutzt. Die Methode übertrifft Text-only-Baselines durchweg und zeigt Robustheit in verschiedenen Textgenerierungseinstellungen, wobei sie auf Standard-Benchmarks wettbewerbsfähig bleibt.

27
ARTICLEDEV.to AI·4/22/2026

AI-genererade texter: Hur plagiatkontroll upptäcker dem

KI-Tools haben die Texterstellung revolutioniert und erschweren die Unterscheidung zwischen menschlich verfassten und KI-generierten Inhalten. Moderne Plagiatskontrollsysteme entwickeln sich weiter, um KI-generierte Texte zu erkennen und die Inhaltsauthentizität durch die Analyse von Sprachmodellen, die Wörter probabilistisch vorhersagen, zu gewährleisten.

24