← heapsort-ai

lossless compression

3 items

RESEARCHarXiv CS.LG·06/05/2026

StateSMix: Online Lossless Compression via Mamba State Space Models and Sparse N-gram Context Mixing

O StateSMix é um compressor sem perdas que combina um Modelo de Espaço de Estado (SSM) estilo Mamba treinado online com mistura de contexto de n-gramas esparsos e codificação aritmética. Ele é inicializado do zero e treinado token a token no arquivo, sem exigir pesos pré-treinados, GPU ou dependências externas, e alcança bons resultados no benchmark enwik8.

27
RESEARCHarXiv CS.LG·06/04/2026

Haiku to Opus in Just 10 bits: LLMs Unlock Massive Compression Gains

Este estudo explora a compressão de texto gerado por LLMs em regimes com e sem perdas, apresentando métodos que melhoram a eficiência em 2x, como adaptadores LoRA e reescritas concisas. Introduz também a compressão interativa por Perguntas e Respostas (QA), um protocolo que transfere um bit por resposta para recuperar uma parte significativa da capacidade de modelos maiores.

27