← heapsort-ai

text generation

16 items

ARTICLE↑ trendingReddit r/LocalLLaMA·27d atrás

TextGen is now a native desktop app. Open-source alternative to LM Studio (formerly text-generation-webui).

TextGen, uma alternativa de código aberto ao LM Studio, evoluiu para um aplicativo de desktop sem instalação para Windows, Linux e macOS. Desenvolvido desde dezembro de 2022, este aplicativo autossuficiente oferece uma interface de usuário aprimorada para geração de texto, funcionando de forma semelhante ao uso do Electron pelo LM Studio.

TextGen is now a native desktop app. Open-source alternative to LM Studio (formerly text-generation-webui).
42
RESEARCHarXiv CS.CL·06/04/2026

Dependency-Guided Parallel Decoding in Discrete Diffusion Language Models

Modelos de linguagem de difusão discreta (dLLMs) aceleram a geração de texto, mas a decodificação paralela degrada a qualidade ao desconsiderar a dependência entre tokens. DEMASK propõe um preditor leve que estima influências condicionais para guiar o desmascaramento simultâneo, comprovadamente melhorando a qualidade. A técnica resulta em um ganho de velocidade de 1.7 a 2.2x, mantendo ou superando o desempenho.

29
RESEARCHarXiv CS.LG·27d atrás

Steering Without Breaking: Mechanistically Informed Interventions for Discrete Diffusion Language Models

Este artigo investiga as limitações das intervenções uniformes em modelos de linguagem de difusão discreta (DLMs), mostrando que elas degradam a qualidade da geração controlada. Os autores descobrem que diferentes atributos se consolidam em estágios distintos do processo de denoising, propondo um agendador adaptativo para concentrar as intervenções eficientemente.

28
RESEARCHarXiv CS.CL·12d atrás

From AR to Diffusion: Efficiently Adapting Large Language Models with Strictly Causal and Elastic Horizons

FLUID é um novo framework que adapta eficientemente modelos Autoregressivos (AR) ao paradigma de difusão para geração paralela de texto. Ele permite a inicialização a partir de modelos GPT e utiliza um mecanismo dinâmico de denoising, resultando em desempenho superior e custos de treinamento drasticamente reduzidos.

28
RESEARCHarXiv CS.CL·06/04/2026

Pragmatics Meets Culture: Culturally-adapted Artwork Description Generation and Evaluation

Este artigo apresenta a tarefa de geração de descrições de arte culturalmente adaptadas para combater o viés cultural em modelos de linguagem na geração de texto aberto. Ele propõe um framework de avaliação baseado em perguntas e respostas culturalmente fundamentadas, mostrando que um modelo de locutor pragmático melhora significativamente a compreensão do ouvinte.

28
RESEARCHarXiv CS.CL·26d atrás

Differences in Text Generated by Diffusion and Autoregressive Language Models

Esta pesquisa explora as diferenças intrínsecas no texto gerado por Modelos de Linguagem de Difusão (DLMs) e Modelos de Linguagem Autorregressivos (ARMs), descobrindo que os DLMs exibem menor entropia n-gram, mas maior coerência e diversidade semântica. Experimentos controlados sugerem que os objetivos de treinamento dos DLMs contribuem para a coerência e diversidade semântica, enquanto os algoritmos de decodificação são responsáveis pela redução da entropia.

27
RESEARCHarXiv CS.CL·07/04/2026

Noise Steering for Controlled Text Generation: Improving Diversity and Reading-Level Fidelity in Arabic Educational Story Generation

O artigo investiga a técnica de "noise steering", que injeta perturbações gaussianas em modelos Transformer durante a inferência, para gerar histórias educacionais em árabe. O método melhora a diversidade narrativa para avaliações de leitura de nível inicial, mantendo a qualidade e o nível de leitura.

27
RESEARCHarXiv CS.CL·08/05/2026

Chainwash: Multi-Step Rewriting Attacks on Diffusion Language Model Watermarks

Este estudo investiga ataques de reescrita multi-passos a marcas d'água em modelos de linguagem de difusão, que visam verificar a autoria de texto por IA. Os resultados demonstram que textos marcados com água podem ter sua detecção comprometida após múltiplas reescritas por outros modelos de linguagem, mesmo aqueles sem conhecimento da chave da marca d'água.

27
RESEARCHarXiv CS.CL·7d atrás

AEyeDE: An Attention-Based Attribution Framework for AI-Generated Text Detection

Este artigo apresenta o AEyeDE, uma abordagem baseada em atenção para detectar textos gerados por IA, que utiliza a atenção do modelo como sinal discriminativo. A metodologia supera consistentemente as linhas de base textuais e demonstra robustez em várias configurações de geração de texto, sendo competitiva em benchmarks padrão.

27