RESEARCH↑ trending43
[P] PCA before truncation makes non-Matryoshka embeddings compressible: results on BGE-M3 [P]
Reddit r/MachineLearning·April 9, 2026
O conteúdo explora a técnica de aplicar PCA antes da truncagem de dimensões para comprimir embeddings, demonstrando que esta abordagem preserva a qualidade dos vetores (similaridade de cosseno) muito melhor do que a truncagem ingênua, especialmente para modelos não Matryoshka como BGE-M3. A técnica também é comparada a outros métodos de compressão, como quantização, mostrando resultados competitivos em termos de desempenho e taxa de compressão.
Read original ↗