← heapsort-ai

lossless compression

3 items

RESEARCHarXiv CS.LG·6/5/2026

StateSMix: Online Lossless Compression via Mamba State Space Models and Sparse N-gram Context Mixing

StateSMix es un compresor sin pérdidas autocontenido que acopla un Modelo de Espacio de Estado (SSM) estilo Mamba entrenado en línea con mezcla de contexto de n-gramas dispersos y codificación aritmética. Se inicializa desde cero y se entrena token por token en el archivo, sin requerir pesos preentrenados, GPU o dependencias externas, y logra buenos resultados en el benchmark enwik8.

27
RESEARCHarXiv CS.LG·6/4/2026

Haiku to Opus in Just 10 bits: LLMs Unlock Massive Compression Gains

Este estudo explora a compressão de texto gerado por LLMs em regimes com e sem perdas, apresentando métodos que melhoram a eficiência em 2x, como adaptadores LoRA e reescritas concisas. Introduz também a compressão interativa por Perguntas e Respostas (QA), um protocolo que transfere um bit por resposta para recuperar uma parte significativa da capacidade de modelos maiores.

27