← heapsort-ai

Dimensionality Reduction

4 items

RESEARCH↑ trendingReddit r/MachineLearning·09/04/2026

[P] PCA before truncation makes non-Matryoshka embeddings compressible: results on BGE-M3 [P]

O conteúdo explora a técnica de aplicar PCA antes da truncagem de dimensões para comprimir embeddings, demonstrando que esta abordagem preserva a qualidade dos vetores (similaridade de cosseno) muito melhor do que a truncagem ingênua, especialmente para modelos não Matryoshka como BGE-M3. A técnica também é comparada a outros métodos de compressão, como quantização, mostrando resultados competitivos em termos de desempenho e taxa de compressão.

43
DOCDEV.to AI·24/04/2026

Visualizing Data using GTSNE

Ce contenu explore la visualisation de données à l'aide de GTSNE, une technique avancée pour réduire la dimensionnalité des ensembles de données complexes. Il détaille comment appliquer GTSNE pour révéler des motifs et des structures intrinsèques dans des données de haute dimension, facilitant l'interprétation et l'analyse.

29
RESEARCHarXiv CS.LG·il y a 21j

AdaGraph: A Graph-Native Clustering Algorithm That Overcomes the Curse of Dimensionality and Enables Scientific Discovery

AdaGraph est un algorithme de clustering natif de graphes, issu du paradigme Structure-Centric Machine Learning (SC-ML), qui résout la malédiction de la dimensionnalité en remplaçant le calcul géocentrique par un calcul basé sur la topologie. Il opère entièrement au sein de la topologie de graphe kNN, ne nécessite pas de spécification a priori du nombre de clusters et s'adapte efficacement.

27