← heapsort-ai

representation learning

23 items

RESEARCHarXiv CS.LG·vor 2T

Principles and Practice of Deep Representation Learning: or a Mathematical Theory of Memory

Dieses Buch versucht, große tiefe Netzwerke und generative Modelle, die oft als „Black Boxes“ wahrgenommen werden, zu entmystifizieren, indem es ihre internen Mechanismen aus der Perspektive des Repräsentationslernens untersucht. Es beschreibt die Designprinzipien moderner neuronaler Netzwerkarchitekturen unter Verwendung von Optimierungs- und Informationstheorie.

60
RESEARCH↑ trendingReddit r/MachineLearning·4/30/2026

[R] Joint Embedding Variational Bayes (TMLR ’26)

Dieses TMLR-Papier führt operationale variationale Semantik in Joint-Embedding-Architekturen für nicht-kontrastives Repräsentationslernen ein. Dies wird durch die Faktorisierung der Embedding-Likelihood, die Verankerung der Posterioren-Unsicherheit an die Likelihood-Skala und die Verwendung einer Student-t-Likelihood mit schweren Enden für empirische Vorteile erreicht.

42
ARTICLEDEV.to AI·4/11/2026

Sparse Federated Representation Learning for deep-sea exploration habitat design for low-power autonomous deployments

Der Autor erforscht Federated Learning, um Latenzprobleme bei umfangreichen Sensordaten von multi-robotischen autonomen Fahrzeugen zu überwinden und die Verarbeitung in Umgebungen mit geringer Bandbreite zu optimieren. Dieser Ansatz sucht eine verteilte Alternative zur zentralisierten Datensynchronisierung durch verteilte Modellaktualisierungen.

29
RESEARCHarXiv CS.AI·vor 28T

Don't Look at the Numbers: Visual Anchoring Bias and Layer-wise Representation in VLMs

Diese Forschungsarbeit zeigt, dass eingebettete numerische Anker auf Bildern systematisch die Qualitätsurteile von Vision-Language-Modellen (VLMs) verzerren. Schichtweise Sondierungen offenbaren, dass optimale Schichten für die Qualitätsprognose tiefer liegen als jene, in denen die Ankerklassifizierung sättigt, was eine kausale Erklärung für die visuelle Verankerungsverzerrung liefert.

29
RESEARCHarXiv CS.LG·vor 6T

Bayes-Sufficient Representations in Supervised Learning

Diese Arbeit definiert Bayes-suffiziente Repräsentationen im überwachten Lernen und konzentriert sich auf Informationen, die für die Vorhersage relevant sind, basierend auf einem festen Entscheidungsproblem und einer Verlustfunktion. Sie führt das Konzept eines Bayes-Quotienten ein und verbindet den Rahmen mit der Eigenschaftselizitation, wobei gezeigt wird, wie verschiedene Verlustfunktionen spezifische Bayes-optimale Aktionen erfordern.

28
RESEARCHarXiv CS.LG·4/21/2026

SetFlow: Generating Structured Sets of Representations for Multiple Instance Learning

Diese Arbeit stellt SetFlow vor, eine generative Architektur, die ganze Multiple-Instance-Learning (MIL)-Säcke direkt im Repräsentationsraum modelliert. Sie nutzt das Flow-Matching-Paradigma und ein Set-Transformer-inspiriertes Design, um Abhängigkeiten innerhalb von Säcken zu erfassen und kohärente, semantisch konsistente Repräsentationen zu generieren.

27
ARTICLEDEV.to AI·5/1/2026

Universal representations:The missing link between faces, text, planktons, andcat breeds

Dieser Inhalt befasst sich mit dem Konzept universeller Repräsentationen in der KI und schlägt sie als das fehlende Glied zur Verbindung und Verarbeitung äußerst unterschiedlicher Datentypen vor. Ziel ist es, einen einheitlichen Rahmen zu schaffen, der von menschlichen Gesichtern und Text bis hin zu Plankton und Katzenrassen alles verstehen kann.

27
RESEARCHarXiv CS.LG·4/13/2026

Silhouette Loss: Differentiable Global Structure Learning for Deep Representations

Dieses Paper stellt den Soft Silhouette Loss vor, ein neuartiges differenzierbares Lernziel für Deep Learning, inspiriert vom klassischen Silhouettenkoeffizienten. Er zielt darauf ab, diskriminative Repräsentationen zu lernen, indem er intra-Klassen-Kompaktheit und inter-Klassen-Trennung effizienter als bestehende Metrik-Lernansätze durchsetzt.

27
RESEARCHarXiv CS.LG·5/8/2026

Data-Driven Variational Basis Learning Beyond Neural Networks: A Non-Neural Framework for Adaptive Basis Discovery

Dieses Manuskript stellt das Data Driven Variational Basis Learning (DVBL) vor, ein neuartiges nicht-neuronales Framework zum Lernen von datenadaptiven Basisfunktionen direkt aus hochdimensionalen Daten. Es bietet eine explizite, interpretierbare und mathematisch transparente Alternative zu neuronalen Netzen für das Repräsentationslernen, die deren Einschränkungen in Bezug auf Kontrolle und Transparenz adressiert.

27
RESEARCHarXiv CS.LG·4/13/2026

Distilling Genomic Models for Efficient mRNA Representation Learning via Embedding Matching

Dieses Papier stellt ein Destillations-Framework vor, um große genomische Grundlagenmodelle für das mRNA-Repräsentationslernen effizienter zu gestalten und die Modellgröße um das 200-fache zu reduzieren. Durch die Verwendung von Embedding-Level-Destillation erreicht das kleinere Modell bei mRNA-bezogenen Aufgaben eine hochmoderne Leistung und demonstriert damit eine effektive Strategie für skalierbare biologische KI.

27
RESEARCHarXiv CS.CL·5/5/2026

H-Probes: Extracting Hierarchical Structures From Latent Representations of Language Models

Diese Arbeit stellt H-Probes vor, lineare Sonden zur Extraktion hierarchischer Strukturen, insbesondere Tiefe und paarweiser Abstand, aus latenten Repräsentationen großer Sprachmodelle. Die Forschung zeigt, dass diese Sonden robust niederdimensionale Unterräume finden, die für die Leistung bei synthetischen Baumdurchlaufaufgaben entscheidend sind und gut innerhalb sowie außerhalb des Bereichs generalisieren.

27
RESEARCHarXiv CS.LG·4/16/2026

The Long Delay to Arithmetic Generalization: When Learned Representations Outrun Behavior

Diese Forschung untersucht das Phänomen des „Grokking“ in Transformatoren und stellt fest, dass die lange Verzögerung bei der Generalisierung in arithmetischen Modellen auf einen Decoder-Engpass zurückzuführen ist. Der Encoder erwirbt relevantes Strukturwissen frühzeitig, doch der Decoder hat Schwierigkeiten, darauf zuzugreifen, eine Hypothese, die durch kausale Interventionen wie das Transplantieren von Encodern gestützt wird.

27
RESEARCHarXiv CS.LG·vor 26T

A Unified Geometric Framework for Weighted Contrastive Learning

Kontrastives Lernen zielt darauf ab, relationale Strukturen zwischen Samples zu erhalten, indem Repräsentationen gelernt werden, die einen Ähnlichkeitsgraphen widerspiegeln. Dieses Papier interpretiert gewichtete InfoNCE-Ziele als Distanzgeometrie-Probleme und bietet einen einheitlichen geometrischen Rahmen sowie exakte Charakterisierungen optimaler Einbettungen, wobei aufgezeigt wird, wie Klassenasymmetrie die Ähnlichkeiten zwischen Klassen in SupCon beeinflusst.

27
RESEARCHarXiv CS.LG·5/7/2026

Transformation Categorization Based on Group Decomposition Theory Using Parameter Division

Diese Forschung untersucht die unbeaufsichtigte Kategorisierung von Transformationen zwischen Eingabepaaren unter Verwendung algebraischer Einschränkungen, um ein prinzipielles Verständnis guter Repräsentationen zu erlangen. Sie schlägt die Parameterdivision vor, um frühere Galois-theoretische Methoden zu verfeinern, indem deren Abhängigkeit von Hilfsannahmen behoben und die Zerlegung von Gruppen verbessert wird.

27
RESEARCHarXiv CS.LG·vor 12T

Emergent Semantic Representations in World Models through Physical Interaction without Linguistic Supervision

Diese Forschung untersucht, wie Weltmodelle semantische Repräsentationen durch physische Erkundung ohne linguistische Supervision lernen. Es wird festgestellt, dass ihr latenter Raum eine räumliche semantische Struktur entwickelt, die die physische Geometrie widerspiegelt, wobei die semantische Ausrichtung mit der Vorhersageleistung mitverbessert wird.

27
RESEARCHarXiv CS.LG·vor 13T

Tackling Multimodal Learning Challenges with Mixture-of-Expert: A Survey

Dieser Artikel präsentiert eine Umfrage, die Herausforderungen des multimodalen Lernens mit der Mixture-of-Experts (MoE)-Architektur behandelt. Die Studie untersucht, wie MoE als effizienter Motor und Repräsentationslerner zur Integration verschiedener Datenmodalitäten fungiert. Sie schließt eine Lücke in der Literatur, indem sie eine umfassende und systematische Übersicht zu diesem Thema bietet.

27