← heapsort-ai

Autoregressive Models

5 items

RESEARCHarXiv CS.CL·12d atrás

From AR to Diffusion: Efficiently Adapting Large Language Models with Strictly Causal and Elastic Horizons

FLUID é um novo framework que adapta eficientemente modelos Autoregressivos (AR) ao paradigma de difusão para geração paralela de texto. Ele permite a inicialização a partir de modelos GPT e utiliza um mecanismo dinâmico de denoising, resultando em desempenho superior e custos de treinamento drasticamente reduzidos.

28
RESEARCHarXiv CS.CL·26d atrás

Differences in Text Generated by Diffusion and Autoregressive Language Models

Esta pesquisa explora as diferenças intrínsecas no texto gerado por Modelos de Linguagem de Difusão (DLMs) e Modelos de Linguagem Autorregressivos (ARMs), descobrindo que os DLMs exibem menor entropia n-gram, mas maior coerência e diversidade semântica. Experimentos controlados sugerem que os objetivos de treinamento dos DLMs contribuem para a coerência e diversidade semântica, enquanto os algoritmos de decodificação são responsáveis pela redução da entropia.

27
RESEARCHarXiv CS.AI·24d atrás

Conditional Attribute Estimation with Autoregressive Sequence Models

Esta pesquisa apresenta os Conditional Attribute Transformers, um novo método para estimar conjuntamente a probabilidade do próximo token e o valor de um atributo condicionalmente a cada seleção potencial do próximo token. Este framework permite capacidades críticas como atribuição de crédito por token e análise contrafactual em uma única passagem, superando limitações dos modelos generativos tradicionais.

27