Autoregressive Models

5 items

RESEARCHarXiv CS.CL·vor 12T

From AR to Diffusion: Efficiently Adapting Large Language Models with Strictly Causal and Elastic Horizons

FLUID ist ein neues Framework, das autoregressive (AR) Backbones effizient an das Diffusionsparadigma zur parallelen Textgenerierung anpasst. Es ermöglicht die Initialisierung von GPT-Modellen und führt einen dynamischen Entrauschungsmechanismus ein, wodurch Spitzenleistungen bei erheblich reduzierten Trainingskosten erzielt werden.

Diffusion Models text generation large language models Autoregressive Models

RESEARCHarXiv CS.CL·vor 26T

Differences in Text Generated by Diffusion and Autoregressive Language Models

Diese Forschung untersucht die intrinsischen Unterschiede in Texten, die von Diffusions-Sprachmodellen (DLMs) und autoregressiven Sprachmodellen (ARMs) generiert werden, und stellt fest, dass DLMs eine geringere n-Gramm-Entropie, aber eine höhere semantische Kohärenz und Diversität aufweisen. Kontrollierte Experimente zeigen, dass die Trainingsziele von DLMs zur Erhöhung der semantischen Kohärenz und Diversität beitragen, während die Dekodierungsalgorithmen für die Entropiereduktion verantwortlich sind.

Diffusion Models language models NLP text generation

RESEARCHarXiv CS.AI·vor 24T

Conditional Attribute Estimation with Autoregressive Sequence Models

Diese Forschung stellt Conditional Attribute Transformers vor, eine neuartige Methode zur gleichzeitigen Schätzung der Wahrscheinlichkeit des nächsten Tokens und des Werts eines Attributs, bedingt durch jede potenzielle Auswahl des nächsten Tokens. Dieser Rahmen ermöglicht wichtige Funktionen wie die Zuweisung von Token-Credits und die kontrafaktische Analyse in einem einzigen Durchlauf und überwindet so Einschränkungen traditioneller generativer Modelle.

deep learning generative models sequence models Conditional Attribute Estimation

RESEARCHarXiv CS.AI·vor 21T

PRISMat: Policy-Driven, Permutation-Invariant Autoregressive Material Generation

Dieses Papier stellt PRISMat vor, ein kosteneffizientes, permutationsinvariantes Modell zur schnellen Identifizierung von Materialkandidaten. Es behebt die Ineffizienzen großer Sprachmodelle bei der Materialerzeugung, indem es eine schnellere und günstigere Alternative zur Filterung von Materialien bietet.

Materials Science AI models machine learning Computational Efficiency

RESEARCHYannic Kilcher (YouTube)·12/27/2025

TiDAR: Think in Diffusion, Talk in Autoregression (Paper Analysis)

Dieser Inhalt bietet eine Analyse eines Forschungsartikels, der das TiDAR-Modell untersucht. Das Modell integriert Konzepte von Diffusion und Autoregression für die Verarbeitung.

Diffusion Models AI models Paper analysis Machine learning research

TiDAR: Think in Diffusion, Talk in Autoregression (Paper Analysis)