Recurrent Neural Networks

4 items

RESEARCHarXiv CS.CL·08/04/2026

Phase-Associative Memory: Sequence Modeling in Complex Hilbert Space

O artigo apresenta a Memória Associativa de Fase (PAM), um modelo de sequência recorrente que utiliza representações de valores complexos e opera em um espaço de Hilbert complexo. O PAM alcança uma perplexidade de validação de 30.0 no WikiText-103, um desempenho competitivo com transformadores, e aborda a degradação da capacidade em modelos de estado vetorial.

Associative Memory Phase-Associative Memory Sequence Modeling Complex Hilbert Space

RESEARCHarXiv CS.LG·14/04/2026

Belief-State RWKV for Reinforcement Learning under Partial Observability

Cet article propose Belief-State RWKV, une formulation plus robuste du RL où l'état récurrent est explicitement interprété comme un état de croyance. La méthode maintient un état compact conscient de l'incertitude, permettant aux politiques de dépendre à la fois de la mémoire et de la confiance dans des environnements partiellement observés.

Belief State RWKV Partial Observability reinforcement learning

RESEARCHarXiv CS.CL·27/04/2026

Where Should LoRA Go? Component-Type Placement in Hybrid Language Models

Cette recherche étudie systématiquement le placement de LoRA dans les modèles de langage hybrides combinant des composants d'attention et récurrents. Elle révèle que l'adaptation du chemin d'attention surpasse constamment l'adaptation du modèle complet avec moins de paramètres, tandis que l'effet de l'adaptation du composant récurrent varie considérablement selon l'architecture hybride.

hybrid language models model adaptation attention mechanisms Recurrent Neural Networks

RESEARCHarXiv CS.LG·il y a 21j

Investigating Action Encodings in Recurrent Neural Networks in Reinforcement Learning

Cet article examine comment les informations d'action peuvent être intégrées dans la fonction de mise à jour d'état d'une cellule récurrente au sein des réseaux neuronaux récurrents (RNN) pour l'apprentissage par renforcement (RL). Les auteurs discutent plusieurs choix et évaluent empiriquement les architectures résultantes sur des domaines illustratifs.

State Building reinforcement learning learning Action Encodings