Autoregressive Models

5 items

RESEARCHarXiv CS.CL·hace 13d

From AR to Diffusion: Efficiently Adapting Large Language Models with Strictly Causal and Elastic Horizons

FLUID es un nuevo framework que adapta eficientemente modelos autorregresivos (AR) al paradigma de difusión para la generación paralela de texto. Permite la inicialización desde modelos tipo GPT e introduce un mecanismo de denoising dinámico, logrando un rendimiento de vanguardia con costos de entrenamiento significativamente menores.

Diffusion Models text generation large language models Autoregressive Models

RESEARCHarXiv CS.CL·hace 27d

Differences in Text Generated by Diffusion and Autoregressive Language Models

Esta investigación examina las diferencias inherentes en el texto generado por Modelos de Lenguaje de Difusión (DLM) y Modelos de Lenguaje Autorregresivos (ARM), encontrando que los DLM muestran menor entropía n-grama, pero mayor coherencia y diversidad semántica. Experimentos controlados indican que los objetivos de entrenamiento de los DLM contribuyen a la coherencia y diversidad semántica, mientras que los algoritmos de decodificación son responsables de la reducción de la entropía.

Diffusion Models language models NLP text generation

RESEARCHarXiv CS.AI·hace 25d

Conditional Attribute Estimation with Autoregressive Sequence Models

Esta investigación introduce los Conditional Attribute Transformers, un método novedoso para estimar conjuntamente la probabilidad del siguiente token y el valor de un atributo condicional a cada selección potencial del siguiente token. Este marco permite capacidades críticas como la asignación de crédito por token y el análisis contrafactual en una sola pasada, superando las limitaciones de los modelos generativos tradicionales.

deep learning generative models sequence models Conditional Attribute Estimation

RESEARCHarXiv CS.AI·hace 22d

PRISMat: Policy-Driven, Permutation-Invariant Autoregressive Material Generation

Este artículo presenta PRISMat, un modelo rentable e invariante a la permutación para la rápida identificación de materiales candidatos. Aborda las ineficiencias de los grandes modelos de lenguaje en la generación de materiales, ofreciendo una alternativa más rápida y económica para filtrarlos.

Materials Science AI models machine learning Computational Efficiency

RESEARCHYannic Kilcher (YouTube)·27/12/2025

TiDAR: Think in Diffusion, Talk in Autoregression (Paper Analysis)

Este contenido presenta un análisis de un artículo de investigación que explora el modelo TiDAR. El modelo integra conceptos de difusión y autorregresión para su procesamiento.

Diffusion Models AI models Paper analysis Machine learning research

TiDAR: Think in Diffusion, Talk in Autoregression (Paper Analysis)