← heapsort-ai

text generation

16 items

ARTICLE↑ trendingReddit r/LocalLLaMA·il y a 27j

TextGen is now a native desktop app. Open-source alternative to LM Studio (formerly text-generation-webui).

TextGen, une alternative open-source à LM Studio, est devenu une application de bureau sans installation pour Windows, Linux et macOS. Développée depuis décembre 2022, cette application autonome offre une interface utilisateur soignée pour la génération de texte, fonctionnant de manière similaire à l'utilisation d'Electron par LM Studio.

TextGen is now a native desktop app. Open-source alternative to LM Studio (formerly text-generation-webui).
42
RESEARCHarXiv CS.CL·06/04/2026

Dependency-Guided Parallel Decoding in Discrete Diffusion Language Models

Modelos de linguagem de difusão discreta (dLLMs) aceleram a geração de texto, mas a decodificação paralela degrada a qualidade ao desconsiderar a dependência entre tokens. DEMASK propõe um preditor leve que estima influências condicionais para guiar o desmascaramento simultâneo, comprovadamente melhorando a qualidade. A técnica resulta em um ganho de velocidade de 1.7 a 2.2x, mantendo ou superando o desempenho.

29
RESEARCHarXiv CS.LG·il y a 27j

Steering Without Breaking: Mechanistically Informed Interventions for Discrete Diffusion Language Models

Cet article examine les limites des interventions uniformes dans les modèles de langage à diffusion discrète (DLMs), démontrant qu'elles dégradent la qualité de la génération contrôlée. Les auteurs constatent que différents attributs se stabilisent à des étapes distinctes du processus de débruitage, proposant un planificateur adaptatif pour concentrer les interventions efficacement.

28
RESEARCHarXiv CS.CL·il y a 12j

From AR to Diffusion: Efficiently Adapting Large Language Models with Strictly Causal and Elastic Horizons

FLUID est un nouveau framework qui adapte efficacement les modèles autorégressifs (AR) au paradigme de diffusion pour la génération de texte parallèle. Il permet l'initialisation à partir de modèles de style GPT et introduit un mécanisme de dénoising dynamique, atteignant des performances de pointe avec des coûts d'entraînement considérablement réduits.

28
RESEARCHarXiv CS.CL·06/04/2026

Pragmatics Meets Culture: Culturally-adapted Artwork Description Generation and Evaluation

Este artigo apresenta a tarefa de geração de descrições de arte culturalmente adaptadas para combater o viés cultural em modelos de linguagem na geração de texto aberto. Ele propõe um framework de avaliação baseado em perguntas e respostas culturalmente fundamentadas, mostrando que um modelo de locutor pragmático melhora significativamente a compreensão do ouvinte.

28
RESEARCHarXiv CS.CL·il y a 26j

Differences in Text Generated by Diffusion and Autoregressive Language Models

Cette recherche explore les différences intrinsèques dans le texte généré par les Modèles de Langage à Diffusion (DLM) et les Modèles de Langage Autorégressifs (ARM), constatant que les DLM présentent une entropie n-gramme inférieure mais une cohérence et une diversité sémantiques plus élevées. Des expériences contrôlées révèlent que les objectifs d'entraînement des DLM améliorent la cohérence et la diversité grâce au contexte bidirectionnel, tandis que les algorithmes de décodage sont responsables de la réduction de l'entropie.

27
RESEARCHarXiv CS.CL·07/04/2026

Noise Steering for Controlled Text Generation: Improving Diversity and Reading-Level Fidelity in Arabic Educational Story Generation

O artigo investiga a técnica de "noise steering", que injeta perturbações gaussianas em modelos Transformer durante a inferência, para gerar histórias educacionais em árabe. O método melhora a diversidade narrativa para avaliações de leitura de nível inicial, mantendo a qualidade e o nível de leitura.

27
RESEARCHarXiv CS.CL·08/05/2026

Chainwash: Multi-Step Rewriting Attacks on Diffusion Language Model Watermarks

Cette étude examine les attaques de réécriture multi-étapes sur les filigranes des modèles de langage à diffusion, qui servent à vérifier l'origine des textes générés par l'IA. Les résultats indiquent que les textes filigranés peuvent voir leur détection compromise après plusieurs réécritures par d'autres modèles de langage, même ceux qui ignorent la clé du filigrane.

27
RESEARCHarXiv CS.CL·il y a 19j

FlowLM: Few-Step Language Modeling via Diffusion-to-Flow Adaptation

FlowLM introduit un nouveau modèle de langage de correspondance de flux, adapté des modèles de diffusion pré-entraînés via un réglage fin efficace. Cette méthode permet une génération de texte de haute qualité en quelques étapes, surpassant significativement l'échantillonnage par diffusion traditionnel avec moins d'époques d'entraînement.

27
RESEARCHarXiv CS.CL·il y a 7j

AEyeDE: An Attention-Based Attribution Framework for AI-Generated Text Detection

Cet article présente AEyeDE, un cadre basé sur l'attention pour la détection de l'attribution humaine-IA qui utilise l'attention du modèle comme signal discriminatoire. La méthode surpasse systématiquement les méthodes de référence basées uniquement sur le texte et fait preuve de robustesse dans divers contextes de génération de texte, restant compétitive sur les bancs d'essai standard.

27
ARTICLEDEV.to AI·22/04/2026

AI-genererade texter: Hur plagiatkontroll upptäcker dem

Les outils d'IA ont transformé la création de textes, rendant difficile la distinction entre le contenu écrit par l'homme et celui généré par l'IA. Les systèmes modernes de contrôle du plagiat évoluent pour détecter les textes générés par l'intelligence artificielle, assurant l'authenticité du contenu en analysant les modèles de langage qui prédisent les mots de manière probabiliste.

24