← heapsort-ai

Dimensionality Reduction

4 items

RESEARCH↑ trendingReddit r/MachineLearning·4/9/2026

[P] PCA before truncation makes non-Matryoshka embeddings compressible: results on BGE-M3 [P]

O conteúdo explora a técnica de aplicar PCA antes da truncagem de dimensões para comprimir embeddings, demonstrando que esta abordagem preserva a qualidade dos vetores (similaridade de cosseno) muito melhor do que a truncagem ingênua, especialmente para modelos não Matryoshka como BGE-M3. A técnica também é comparada a outros métodos de compressão, como quantização, mostrando resultados competitivos em termos de desempenho e taxa de compressão.

43
DOCDEV.to AI·4/24/2026

Visualizing Data using GTSNE

Dieser Inhalt befasst sich mit der Datenvisualisierung mittels GTSNE, einer fortschrittlichen Technik zur Reduzierung der Dimensionalität komplexer Datensätze. Er beschreibt, wie GTSNE angewendet wird, um intrinsische Muster und Strukturen in hochdimensionalen Daten aufzudecken und so deren Interpretation und Analyse zu erleichtern.

29
RESEARCHarXiv CS.LG·vor 21T

AdaGraph: A Graph-Native Clustering Algorithm That Overcomes the Curse of Dimensionality and Enables Scientific Discovery

AdaGraph ist ein graph-natives Clustering-Algorithmus aus dem Structure-Centric Machine Learning (SC-ML) Paradigma, der den Fluch der Dimensionalität durch topologiebasierte Berechnungen auflöst. Er arbeitet vollständig innerhalb der kNN-Graphtopologie, erfordert keine vorherige Angabe der Clusteranzahl und ist effizient skalierbar.

27