text generation

16 items

ARTICLE↑ trendingReddit r/LocalLLaMA·27d atrás

TextGen is now a native desktop app. Open-source alternative to LM Studio (formerly text-generation-webui).

TextGen, uma alternativa de código aberto ao LM Studio, evoluiu para um aplicativo de desktop sem instalação para Windows, Linux e macOS. Desenvolvido desde dezembro de 2022, este aplicativo autossuficiente oferece uma interface de usuário aprimorada para geração de texto, funcionando de forma semelhante ao uso do Electron pelo LM Studio.

desktop app Open Source LLMs text generation

TextGen is now a native desktop app. Open-source alternative to LM Studio (formerly text-generation-webui).

RESEARCHarXiv CS.CL·06/04/2026

Dependency-Guided Parallel Decoding in Discrete Diffusion Language Models

Modelos de linguagem de difusão discreta (dLLMs) aceleram a geração de texto, mas a decodificação paralela degrada a qualidade ao desconsiderar a dependência entre tokens. DEMASK propõe um preditor leve que estima influências condicionais para guiar o desmascaramento simultâneo, comprovadamente melhorando a qualidade. A técnica resulta em um ganho de velocidade de 1.7 a 2.2x, mantendo ou superando o desempenho.

Dependency Prediction DEMASK Parallel Decoding machine learning

RESEARCHarXiv CS.LG·27d atrás

Steering Without Breaking: Mechanistically Informed Interventions for Discrete Diffusion Language Models

Este artigo investiga as limitações das intervenções uniformes em modelos de linguagem de difusão discreta (DLMs), mostrando que elas degradam a qualidade da geração controlada. Os autores descobrem que diferentes atributos se consolidam em estágios distintos do processo de denoising, propondo um agendador adaptativo para concentrar as intervenções eficientemente.

Diffusion Models language models Controlled Generation text generation

RESEARCHarXiv CS.CL·12d atrás

From AR to Diffusion: Efficiently Adapting Large Language Models with Strictly Causal and Elastic Horizons

FLUID é um novo framework que adapta eficientemente modelos Autoregressivos (AR) ao paradigma de difusão para geração paralela de texto. Ele permite a inicialização a partir de modelos GPT e utiliza um mecanismo dinâmico de denoising, resultando em desempenho superior e custos de treinamento drasticamente reduzidos.

Diffusion Models text generation large language models Autoregressive Models

RESEARCHarXiv CS.CL·06/04/2026

Pragmatics Meets Culture: Culturally-adapted Artwork Description Generation and Evaluation

Este artigo apresenta a tarefa de geração de descrições de arte culturalmente adaptadas para combater o viés cultural em modelos de linguagem na geração de texto aberto. Ele propõe um framework de avaliação baseado em perguntas e respostas culturalmente fundamentadas, mostrando que um modelo de locutor pragmático melhora significativamente a compreensão do ouvinte.

Art Description language models evaluation Pragmatics

RESEARCHarXiv CS.CL·26d atrás

Differences in Text Generated by Diffusion and Autoregressive Language Models

Esta pesquisa explora as diferenças intrínsecas no texto gerado por Modelos de Linguagem de Difusão (DLMs) e Modelos de Linguagem Autorregressivos (ARMs), descobrindo que os DLMs exibem menor entropia n-gram, mas maior coerência e diversidade semântica. Experimentos controlados sugerem que os objetivos de treinamento dos DLMs contribuem para a coerência e diversidade semântica, enquanto os algoritmos de decodificação são responsáveis pela redução da entropia.

Diffusion Models language models NLP text generation

DOCML Mastery·13d atrás

The Statistics of Token Selection: Logits, Temperature, and Top-P Walkthrough

Este conteúdo explica o processo de seleção de tokens em grandes modelos de linguagem (LLMs). Ele detalha como critérios como logits, temperatura e top-p influenciam a coerência e a criatividade das saídas geradas.

LLMs Token Selection deep learning machine learning

The Statistics of Token Selection: Logits, Temperature, and Top-P Walkthrough

RESEARCHHugging Face Blog·17d atrás

Towards Speed-of-Light Text Generation with Nemotron-Labs Diffusion Language Models

Este conteúdo aborda o desenvolvimento de modelos de linguagem de difusão da Nemotron-Labs visando a geração de texto em velocidades excepcionalmente altas. O foco está em avanços técnicos para otimizar a rapidez da produção textual.

Diffusion Models language models Nemotron-Labs text generation

ARTICLEDEV.to AI·13d atrás

Meet EAGLE 3.1: A Friendly Fix for AI's Attention Issues

EAGLE 3.1 é uma ferramenta inovadora projetada para ajudar a inteligência artificial a manter o foco durante conversas e na geração de texto, combatendo a "deriva de atenção" em LLMs. Este fenômeno pode tornar as respostas da IA menos coerentes, similar a perder o foco ao ler um livro.

Attention Mechanism text generation EAGLE 3.1 AI

RESEARCHarXiv CS.CL·07/04/2026

Noise Steering for Controlled Text Generation: Improving Diversity and Reading-Level Fidelity in Arabic Educational Story Generation

O artigo investiga a técnica de "noise steering", que injeta perturbações gaussianas em modelos Transformer durante a inferência, para gerar histórias educacionais em árabe. O método melhora a diversidade narrativa para avaliações de leitura de nível inicial, mantendo a qualidade e o nível de leitura.

Noise Steering NLP Diversity text generation Transformer Models

RESEARCHDEV.to AI·20d atrás

DualFashion: Dual-Diffusion Transformer Generates Outfit Images & Text

DualFashion é uma arquitetura Transformer de dupla difusão que gera conjuntamente imagens de moda e descrições textuais. Ele supera métodos de última geração em benchmarks iFashion e Polyvore-U para recomendação de roupas, oferecendo saídas interpretáveis.

Diffusion Models image generation text generation fashion AI

RESEARCHarXiv CS.CL·08/05/2026

Chainwash: Multi-Step Rewriting Attacks on Diffusion Language Model Watermarks

Este estudo investiga ataques de reescrita multi-passos a marcas d'água em modelos de linguagem de difusão, que visam verificar a autoria de texto por IA. Os resultados demonstram que textos marcados com água podem ter sua detecção comprometida após múltiplas reescritas por outros modelos de linguagem, mesmo aqueles sem conhecimento da chave da marca d'água.

Diffusion Models language models AI watermarking security

RESEARCHarXiv CS.CL·19d atrás

FlowLM: Few-Step Language Modeling via Diffusion-to-Flow Adaptation

FlowLM introduz um novo modelo de linguagem de correspondência de fluxo, adaptado de modelos de difusão pré-treinados por meio de um ajuste fino eficiente. Este método permite a geração de texto de alta qualidade em poucos passos, superando significativamente a amostragem de difusão tradicional com menos épocas de treinamento.

Diffusion Models language models machine learning text generation

RESEARCHarXiv CS.CL·7d atrás

AEyeDE: An Attention-Based Attribution Framework for AI-Generated Text Detection

Este artigo apresenta o AEyeDE, uma abordagem baseada em atenção para detectar textos gerados por IA, que utiliza a atenção do modelo como sinal discriminativo. A metodologia supera consistentemente as linhas de base textuais e demonstra robustez em várias configurações de geração de texto, sendo competitiva em benchmarks padrão.

AI detection machine learning NLP attention mechanisms

DOCDEV.to AI·14d atrás

How LLMs Actually Work — From Tokens to Text (with Python)

Este conteúdo explica o mecanismo fundamental dos Modelos de Linguagem Grandes (LLMs) como o ChatGPT, detalhando como eles preveem o próximo token para gerar texto. Descreve o pipeline desde a tokenização e representação vetorial até os mecanismos de atenção e o processo iterativo de geração de texto.

learning text generation Python Tokenization

ARTICLEDEV.to AI·22/04/2026

AI-genererade texter: Hur plagiatkontroll upptäcker dem

Ferramentas de IA transformaram a criação de textos, tornando um desafio distinguir entre conteúdo escrito por humanos e gerado por IA. A moderna tecnologia de controle de plágio está se adaptando para detectar textos gerados por inteligência artificial, utilizando a análise de modelos de linguagem que preveem palavras com base em probabilidade.

language models plagiarism text generation content authenticity