← heapsort-ai

Embedding Compression

2 items

NEWS↑ trendingReddit r/MachineLearning·09/04/2026

[P] turboquant-pro autotune: One command finds the optimal compression for your vector database [R]

Foi lançada uma nova ferramenta CLI, turboquant-pro autotune, que automatiza a descoberta da configuração ideal de compressão para embeddings em bancos de dados de vetores PostgreSQL. Ela analisa diversas opções para otimizar a eficiência de armazenamento e a qualidade de recall, simplificando a gestão de milhões de embeddings.

44
RESEARCH↑ trendingReddit r/MachineLearning·09/04/2026

[P] PCA before truncation makes non-Matryoshka embeddings compressible: results on BGE-M3 [P]

O conteúdo explora a técnica de aplicar PCA antes da truncagem de dimensões para comprimir embeddings, demonstrando que esta abordagem preserva a qualidade dos vetores (similaridade de cosseno) muito melhor do que a truncagem ingênua, especialmente para modelos não Matryoshka como BGE-M3. A técnica também é comparada a outros métodos de compressão, como quantização, mostrando resultados competitivos em termos de desempenho e taxa de compressão.

43