← heapsort-ai

State Space Models

5 items

RESEARCHarXiv CS.LG·21/4/2026

UniMamba: A Unified Spatial-Temporal Modeling Framework with State-Space and Attention Integration

UniMamba es un nuevo marco unificado de pronóstico espacio-temporal que integra dinámicas eficientes de modelos de espacio de estados con aprendizaje de dependencias basado en atención para abordar desafíos de series temporales multivariadas. Emplea una Capa de Codificación de Canal Variado Mamba y una Capa de Atención Temporal Espacial para capturar tanto las dependencias temporales globales como las correlaciones entre variables.

33
RESEARCHarXiv CS.LG·8/5/2026

Sparse Prefix Caching for Hybrid and Recurrent LLM Serving

Este artículo presenta el almacenamiento en caché de prefijos dispersos, una optimización para la distribución de LLM que almacena estados recurrentes en puntos de control en lugar de todo el historial de tokens. El método mejora consistentemente la frontera de Pareto en comparación con las heurísticas estándar, especialmente para casos de uso donde las solicitudes comparten un prefijo no trivial.

27
RESEARCHarXiv CS.LG·hace 12d

A Simple State Space Model Excels at Multivariate Time Series Classification

Esta investigación estudia sistemáticamente los modelos de espacio de estados estructurados (SSM) para la clasificación de series temporales, comparando arquitecturas complejas basadas en Mamba con SSM diagonales más simples (S4D). Sorprendentemente, S4D supera consistentemente a las variantes de Mamba en precisión y eficiencia en grandes benchmarks, desafiando la suposición de que una mayor complejidad del modelo conduce a un mejor rendimiento en este dominio.

27
RESEARCHarXiv CS.LG·6/5/2026

StateSMix: Online Lossless Compression via Mamba State Space Models and Sparse N-gram Context Mixing

StateSMix es un compresor sin pérdidas autocontenido que acopla un Modelo de Espacio de Estado (SSM) estilo Mamba entrenado en línea con mezcla de contexto de n-gramas dispersos y codificación aritmética. Se inicializa desde cero y se entrena token por token en el archivo, sin requerir pesos preentrenados, GPU o dependencias externas, y logra buenos resultados en el benchmark enwik8.

27