State Space Models

5 items

RESEARCHarXiv CS.LG·4/21/2026

UniMamba: A Unified Spatial-Temporal Modeling Framework with State-Space and Attention Integration

UniMamba ist ein neues einheitliches räumlich-zeitliches Prognoseframework, das effiziente Zustandsraumdynamiken mit auf Aufmerksamkeit basierendem Abhängigkeitslernen integriert, um Herausforderungen bei multivariaten Zeitreihen zu bewältigen. Es nutzt eine Mamba Variate-Channel Encoding Layer und eine Spatial Temporal Attention Layer, um sowohl globale zeitliche Abhängigkeiten als auch Inter-Variablen-Korrelationen zu erfassen.

forecasting machine learning attention mechanisms State Space Models

RESEARCHarXiv CS.LG·5/8/2026

Sparse Prefix Caching for Hybrid and Recurrent LLM Serving

Dieser Artikel stellt Sparse Prefix Caching vor, eine Optimierung für das Bereitstellen von LLMs, die wiederkehrende Zustände an Prüfpunkten speichert, anstatt den gesamten Token-Verlauf zu benötigen. Die Methode verbessert die Pareto-Grenze im Vergleich zu Standard-Heuristiken, insbesondere bei Anwendungsfällen, in denen Anfragen ein nicht triviales Präfix teilen.

LLMs AI infrastructure Caching performance

RESEARCHarXiv CS.LG·vor 12T

A Simple State Space Model Excels at Multivariate Time Series Classification

Diese Forschung untersucht systematisch strukturierte Zustandsraummodelle (SSMs) für die Zeitreihenklassifizierung und vergleicht komplexe Mamba-basierte Architekturen mit einfacheren diagonalen SSMs (S4D). Überraschenderweise übertrifft S4D Mamba-Varianten konsistent in Genauigkeit und Effizienz bei großen Benchmarks, was die Annahme in Frage stellt, dass eine erhöhte Modellkomplexität zu besseren Leistungen in diesem Bereich führt.

Time Series Classification deep learning machine learning Sequence Modeling

RESEARCHarXiv CS.LG·5/6/2026

StateSMix: Online Lossless Compression via Mamba State Space Models and Sparse N-gram Context Mixing

StateSMix ist ein eigenständiger verlustfreier Kompressor, der ein online-trainiertes Mamba-ähnliches State Space Model (SSM) mit sparsamer N-Gramm-Kontextmischung und arithmetischer Kodierung kombiniert. Es wird von Grund auf neu initialisiert und Token für Token auf der zu komprimierenden Datei trainiert, benötigt keine vortrainierten Gewichte, keine GPU und keine externen Abhängigkeiten, und erzielt gute Ergebnisse beim enwik8-Benchmark.

AI models Mamba lossless compression N-gram

ARTICLEThe AI Epiphany (YouTube)·6/16/2024

State Space Models w/ Albert Gu & Karan Goel (Cartesia AI)

Dieser Inhalt behandelt Zustandsraummodelle, mit Albert Gu und Karan Goel von Cartesia AI. Er diskutiert ein relevantes technisches Thema im Bereich der künstlichen Intelligenz.

AI models machine learning State Space Models

State Space Models w/ Albert Gu & Karan Goel (Cartesia AI)