RESEARCH27
StateSMix: Online Lossless Compression via Mamba State Space Models and Sparse N-gram Context Mixing
arXiv CS.LG·6 de mayo de 2026
StateSMix es un compresor sin pérdidas autocontenido que acopla un Modelo de Espacio de Estado (SSM) estilo Mamba entrenado en línea con mezcla de contexto de n-gramas dispersos y codificación aritmética. Se inicializa desde cero y se entrena token por token en el archivo, sin requerir pesos preentrenados, GPU o dependencias externas, y logra buenos resultados en el benchmark enwik8.
Leer original ↗