Autoregressive Models

5 items

RESEARCHarXiv CS.CL·il y a 12j

From AR to Diffusion: Efficiently Adapting Large Language Models with Strictly Causal and Elastic Horizons

FLUID est un nouveau framework qui adapte efficacement les modèles autorégressifs (AR) au paradigme de diffusion pour la génération de texte parallèle. Il permet l'initialisation à partir de modèles de style GPT et introduit un mécanisme de dénoising dynamique, atteignant des performances de pointe avec des coûts d'entraînement considérablement réduits.

Diffusion Models text generation large language models Autoregressive Models

RESEARCHarXiv CS.CL·il y a 26j

Differences in Text Generated by Diffusion and Autoregressive Language Models

Cette recherche explore les différences intrinsèques dans le texte généré par les Modèles de Langage à Diffusion (DLM) et les Modèles de Langage Autorégressifs (ARM), constatant que les DLM présentent une entropie n-gramme inférieure mais une cohérence et une diversité sémantiques plus élevées. Des expériences contrôlées révèlent que les objectifs d'entraînement des DLM améliorent la cohérence et la diversité grâce au contexte bidirectionnel, tandis que les algorithmes de décodage sont responsables de la réduction de l'entropie.

Diffusion Models language models NLP text generation

RESEARCHarXiv CS.AI·il y a 24j

Conditional Attribute Estimation with Autoregressive Sequence Models

Cette recherche introduit les Conditional Attribute Transformers, une nouvelle méthode pour estimer conjointement la probabilité du prochain token et la valeur d'un attribut conditionnellement à chaque sélection potentielle du prochain token. Ce cadre permet des capacités critiques telles que l'attribution de crédit par token et l'analyse contrefactuelle en un seul passage, surmontant les limites des modèles génératifs traditionnels.

deep learning generative models sequence models Conditional Attribute Estimation

RESEARCHarXiv CS.AI·il y a 21j

PRISMat: Policy-Driven, Permutation-Invariant Autoregressive Material Generation

Cet article introduit PRISMat, un modèle économique et invariant par permutation pour l'identification rapide de matériaux candidats. Il aborde les inefficacités des grands modèles linguistiques dans la génération de matériaux en offrant une alternative plus rapide et moins coûteuse pour filtrer les matériaux.

Materials Science AI models machine learning Computational Efficiency

RESEARCHYannic Kilcher (YouTube)·27/12/2025

TiDAR: Think in Diffusion, Talk in Autoregression (Paper Analysis)

Ce contenu propose une analyse d'un article de recherche explorant le modèle TiDAR. Le modèle intègre des concepts de diffusion et d'autorégression pour le traitement.

Diffusion Models AI models Paper analysis Machine learning research

TiDAR: Think in Diffusion, Talk in Autoregression (Paper Analysis)