text generation

16 items

ARTICLE↑ trendingReddit r/LocalLLaMA·il y a 27j

TextGen is now a native desktop app. Open-source alternative to LM Studio (formerly text-generation-webui).

TextGen, une alternative open-source à LM Studio, est devenu une application de bureau sans installation pour Windows, Linux et macOS. Développée depuis décembre 2022, cette application autonome offre une interface utilisateur soignée pour la génération de texte, fonctionnant de manière similaire à l'utilisation d'Electron par LM Studio.

desktop app Open Source LLMs text generation

TextGen is now a native desktop app. Open-source alternative to LM Studio (formerly text-generation-webui).

RESEARCHarXiv CS.CL·06/04/2026

Dependency-Guided Parallel Decoding in Discrete Diffusion Language Models

Modelos de linguagem de difusão discreta (dLLMs) aceleram a geração de texto, mas a decodificação paralela degrada a qualidade ao desconsiderar a dependência entre tokens. DEMASK propõe um preditor leve que estima influências condicionais para guiar o desmascaramento simultâneo, comprovadamente melhorando a qualidade. A técnica resulta em um ganho de velocidade de 1.7 a 2.2x, mantendo ou superando o desempenho.

Dependency Prediction DEMASK Parallel Decoding machine learning

RESEARCHarXiv CS.LG·il y a 27j

Steering Without Breaking: Mechanistically Informed Interventions for Discrete Diffusion Language Models

Cet article examine les limites des interventions uniformes dans les modèles de langage à diffusion discrète (DLMs), démontrant qu'elles dégradent la qualité de la génération contrôlée. Les auteurs constatent que différents attributs se stabilisent à des étapes distinctes du processus de débruitage, proposant un planificateur adaptatif pour concentrer les interventions efficacement.

Diffusion Models language models Controlled Generation text generation

RESEARCHarXiv CS.CL·il y a 12j

From AR to Diffusion: Efficiently Adapting Large Language Models with Strictly Causal and Elastic Horizons

FLUID est un nouveau framework qui adapte efficacement les modèles autorégressifs (AR) au paradigme de diffusion pour la génération de texte parallèle. Il permet l'initialisation à partir de modèles de style GPT et introduit un mécanisme de dénoising dynamique, atteignant des performances de pointe avec des coûts d'entraînement considérablement réduits.

Diffusion Models text generation large language models Autoregressive Models

RESEARCHarXiv CS.CL·06/04/2026

Pragmatics Meets Culture: Culturally-adapted Artwork Description Generation and Evaluation

Este artigo apresenta a tarefa de geração de descrições de arte culturalmente adaptadas para combater o viés cultural em modelos de linguagem na geração de texto aberto. Ele propõe um framework de avaliação baseado em perguntas e respostas culturalmente fundamentadas, mostrando que um modelo de locutor pragmático melhora significativamente a compreensão do ouvinte.

Art Description language models evaluation Pragmatics

RESEARCHarXiv CS.CL·il y a 26j

Differences in Text Generated by Diffusion and Autoregressive Language Models

Cette recherche explore les différences intrinsèques dans le texte généré par les Modèles de Langage à Diffusion (DLM) et les Modèles de Langage Autorégressifs (ARM), constatant que les DLM présentent une entropie n-gramme inférieure mais une cohérence et une diversité sémantiques plus élevées. Des expériences contrôlées révèlent que les objectifs d'entraînement des DLM améliorent la cohérence et la diversité grâce au contexte bidirectionnel, tandis que les algorithmes de décodage sont responsables de la réduction de l'entropie.

Diffusion Models language models NLP text generation

DOCML Mastery·il y a 13j

The Statistics of Token Selection: Logits, Temperature, and Top-P Walkthrough

Ce contenu explique le processus de sélection des jetons dans les grands modèles de langage (LLM). Il détaille comment des critères tels que les logits, la température et le top-p influencent la cohérence et la créativité des sorties générées.

LLMs Token Selection deep learning machine learning

The Statistics of Token Selection: Logits, Temperature, and Top-P Walkthrough

RESEARCHHugging Face Blog·il y a 18j

Towards Speed-of-Light Text Generation with Nemotron-Labs Diffusion Language Models

Ce contenu aborde le développement de modèles de langage de diffusion de Nemotron-Labs visant à atteindre une génération de texte à une vitesse exceptionnellement élevée. L'accent est mis sur les avancées techniques pour optimiser la rapidité de la production textuelle.

Diffusion Models language models Nemotron-Labs text generation

ARTICLEDEV.to AI·il y a 13j

Meet EAGLE 3.1: A Friendly Fix for AI's Attention Issues

EAGLE 3.1 est un outil innovant conçu pour aider l'IA à rester concentrée lors des conversations et de la génération de texte, luttant contre la "dérive d'attention" dans les LLM. Ce phénomène peut rendre les réponses de l'IA moins cohérentes, semblable à perdre le fil en lisant un livre.

Attention Mechanism text generation EAGLE 3.1 AI

RESEARCHarXiv CS.CL·07/04/2026

Noise Steering for Controlled Text Generation: Improving Diversity and Reading-Level Fidelity in Arabic Educational Story Generation

O artigo investiga a técnica de "noise steering", que injeta perturbações gaussianas em modelos Transformer durante a inferência, para gerar histórias educacionais em árabe. O método melhora a diversidade narrativa para avaliações de leitura de nível inicial, mantendo a qualidade e o nível de leitura.

Noise Steering NLP Diversity text generation Transformer Models

RESEARCHDEV.to AI·il y a 20j

DualFashion: Dual-Diffusion Transformer Generates Outfit Images & Text

DualFashion est une architecture Transformer à double diffusion qui génère conjointement des images d'articles de mode et des descriptions textuelles. Il surpasse les méthodes de pointe sur les benchmarks iFashion et Polyvore-U pour la recommandation générative de tenues, fournissant des résultats interprétables.

Diffusion Models image generation text generation fashion AI

RESEARCHarXiv CS.CL·08/05/2026

Chainwash: Multi-Step Rewriting Attacks on Diffusion Language Model Watermarks

Cette étude examine les attaques de réécriture multi-étapes sur les filigranes des modèles de langage à diffusion, qui servent à vérifier l'origine des textes générés par l'IA. Les résultats indiquent que les textes filigranés peuvent voir leur détection compromise après plusieurs réécritures par d'autres modèles de langage, même ceux qui ignorent la clé du filigrane.

Diffusion Models language models AI watermarking security

RESEARCHarXiv CS.CL·il y a 19j

FlowLM: Few-Step Language Modeling via Diffusion-to-Flow Adaptation

FlowLM introduit un nouveau modèle de langage de correspondance de flux, adapté des modèles de diffusion pré-entraînés via un réglage fin efficace. Cette méthode permet une génération de texte de haute qualité en quelques étapes, surpassant significativement l'échantillonnage par diffusion traditionnel avec moins d'époques d'entraînement.

Diffusion Models language models machine learning text generation

RESEARCHarXiv CS.CL·il y a 7j

AEyeDE: An Attention-Based Attribution Framework for AI-Generated Text Detection

Cet article présente AEyeDE, un cadre basé sur l'attention pour la détection de l'attribution humaine-IA qui utilise l'attention du modèle comme signal discriminatoire. La méthode surpasse systématiquement les méthodes de référence basées uniquement sur le texte et fait preuve de robustesse dans divers contextes de génération de texte, restant compétitive sur les bancs d'essai standard.

AI detection machine learning NLP attention mechanisms

DOCDEV.to AI·il y a 14j

How LLMs Actually Work — From Tokens to Text (with Python)

Ce contenu explique le mécanisme fondamental des Grands Modèles Linguistiques (LLMs) comme ChatGPT, détaillant comment ils prédisent le prochain token pour générer du texte. Il décrit le pipeline depuis la tokenisation et la représentation vectorielle jusqu'aux mécanismes d'attention et le processus itératif de génération de texte.

learning text generation Python Tokenization

ARTICLEDEV.to AI·22/04/2026

AI-genererade texter: Hur plagiatkontroll upptäcker dem

Les outils d'IA ont transformé la création de textes, rendant difficile la distinction entre le contenu écrit par l'homme et celui généré par l'IA. Les systèmes modernes de contrôle du plagiat évoluent pour détecter les textes générés par l'intelligence artificielle, assurant l'authenticité du contenu en analysant les modèles de langage qui prédisent les mots de manière probabiliste.

language models plagiarism text generation content authenticity