← heapsort-ai

State Space Models

5 items

RESEARCHarXiv CS.LG·21/04/2026

UniMamba: A Unified Spatial-Temporal Modeling Framework with State-Space and Attention Integration

UniMamba é um novo framework unificado de previsão espaço-temporal que integra dinâmicas eficientes de modelos de espaço de estados com aprendizado de dependências baseado em atenção para lidar com desafios de séries temporais multivariadas. Ele emprega uma camada de Codificação de Canal Variado Mamba e uma Camada de Atenção Temporal Espacial para capturar tanto as dependências temporais globais quanto as correlações inter-variáveis.

33
RESEARCHarXiv CS.LG·08/05/2026

Sparse Prefix Caching for Hybrid and Recurrent LLM Serving

Este artigo apresenta o cache de prefixo esparso, uma otimização para servir LLMs que armazena estados recorrentes em pontos de verificação em vez de todo o histórico de tokens. O método melhora consistentemente a fronteira de Pareto em comparação com heurísticas padrão, especialmente para casos de uso onde as requisições compartilham um prefixo não trivial.

27
RESEARCHarXiv CS.LG·12d atrás

A Simple State Space Model Excels at Multivariate Time Series Classification

Esta pesquisa estuda sistematicamente os modelos de espaço de estados estruturados (SSMs) para classificação de séries temporais, comparando arquiteturas complexas baseadas em Mamba com SSMs diagonais mais simples (S4D). Surpreendentemente, o S4D supera consistentemente as variantes Mamba em precisão e eficiência em grandes benchmarks, desafiando a suposição de que o aumento da complexidade do modelo leva a um melhor desempenho neste domínio.

27
RESEARCHarXiv CS.LG·06/05/2026

StateSMix: Online Lossless Compression via Mamba State Space Models and Sparse N-gram Context Mixing

O StateSMix é um compressor sem perdas que combina um Modelo de Espaço de Estado (SSM) estilo Mamba treinado online com mistura de contexto de n-gramas esparsos e codificação aritmética. Ele é inicializado do zero e treinado token a token no arquivo, sem exigir pesos pré-treinados, GPU ou dependências externas, e alcança bons resultados no benchmark enwik8.

27