representation learning

23 items

RESEARCHarXiv CS.LG·vor 2T

Principles and Practice of Deep Representation Learning: or a Mathematical Theory of Memory

Dieses Buch versucht, große tiefe Netzwerke und generative Modelle, die oft als „Black Boxes“ wahrgenommen werden, zu entmystifizieren, indem es ihre internen Mechanismen aus der Perspektive des Repräsentationslernens untersucht. Es beschreibt die Designprinzipien moderner neuronaler Netzwerkarchitekturen unter Verwendung von Optimierungs- und Informationstheorie.

neural networks deep learning learning generative models

RESEARCH↑ trendingReddit r/MachineLearning·4/30/2026

[R] Joint Embedding Variational Bayes (TMLR ’26)

Dieses TMLR-Papier führt operationale variationale Semantik in Joint-Embedding-Architekturen für nicht-kontrastives Repräsentationslernen ein. Dies wird durch die Faktorisierung der Embedding-Likelihood, die Verankerung der Posterioren-Unsicherheit an die Likelihood-Skala und die Verwendung einer Student-t-Likelihood mit schweren Enden für empirische Vorteile erreicht.

Variational Inference Deep Learning Models machine learning representation learning

RESEARCHDEV.to AI·vor 2T

Subject-Aware Contrastive Learning for Biosignals

Diese Forschung konzentriert sich auf das Subjekt-Aware Contrastive Learning, eine neuartige KI-Technik, die für die effektive Verarbeitung und das Verständnis von Biosignalen entwickelt wurde. Sie zielt darauf ab, das Repräsentationslernen komplexer biologischer Daten zu verbessern und Fortschritte in der Analyse physiologischer Messungen zu bieten.

contrastive learning learning machine learning biosignals

ARTICLEDEV.to AI·4/22/2026

Autoencoders and Representation Learning in Vision

Autoencoder sind neuronale Netze, die Daten in einen niedrigerdimensionalen Raum komprimieren und das Original rekonstruieren, wobei sie im Gegensatz zur linearen PCA nicht-lineare Strukturen lernen. Ihr zweistufiges Design umfasst einen Encoder, der Eingabedaten in einen latenten Raum projiziert, um die informativsten Merkmale zu extrahieren.

neural networks deep learning autoencoders machine learning

ARTICLEDEV.to AI·4/11/2026

Sparse Federated Representation Learning for deep-sea exploration habitat design for low-power autonomous deployments

Der Autor erforscht Federated Learning, um Latenzprobleme bei umfangreichen Sensordaten von multi-robotischen autonomen Fahrzeugen zu überwinden und die Verarbeitung in Umgebungen mit geringer Bandbreite zu optimieren. Dieser Ansatz sucht eine verteilte Alternative zur zentralisierten Datensynchronisierung durch verteilte Modellaktualisierungen.

Autonomous systems Distributed AI Deep-sea exploration federated learning

RESEARCHarXiv CS.AI·vor 28T

Don't Look at the Numbers: Visual Anchoring Bias and Layer-wise Representation in VLMs

Diese Forschungsarbeit zeigt, dass eingebettete numerische Anker auf Bildern systematisch die Qualitätsurteile von Vision-Language-Modellen (VLMs) verzerren. Schichtweise Sondierungen offenbaren, dass optimale Schichten für die Qualitätsprognose tiefer liegen als jene, in denen die Ankerklassifizierung sättigt, was eine kausale Erklärung für die visuelle Verankerungsverzerrung liefert.

neural networks Vision-Language Models Model Evaluation representation learning

RESEARCHDEV.to AI·5/9/2026

Anticipating Visual Representations from Unlabeled Video

Dieser Inhalt untersucht Methoden zur Antizipation visueller Repräsentationen aus unbeschrifteten Videos. Die Forschung befasst sich mit der Fähigkeit von Modellen, visuelle Merkmale ohne explizite Überwachung zu lernen, um das kontextuelle Verständnis in Videosequenzen zu verbessern.

computer vision representation learning video-analysis unsupervised learning

RESEARCHarXiv CS.LG·vor 6T

Bayes-Sufficient Representations in Supervised Learning

Diese Arbeit definiert Bayes-suffiziente Repräsentationen im überwachten Lernen und konzentriert sich auf Informationen, die für die Vorhersage relevant sind, basierend auf einem festen Entscheidungsproblem und einer Verlustfunktion. Sie führt das Konzept eines Bayes-Quotienten ein und verbindet den Rahmen mit der Eigenschaftselizitation, wobei gezeigt wird, wie verschiedene Verlustfunktionen spezifische Bayes-optimale Aktionen erfordern.

learning Bayesian theory supervised learning representation learning

RESEARCHarXiv CS.LG·4/21/2026

SetFlow: Generating Structured Sets of Representations for Multiple Instance Learning

Diese Arbeit stellt SetFlow vor, eine generative Architektur, die ganze Multiple-Instance-Learning (MIL)-Säcke direkt im Repräsentationsraum modelliert. Sie nutzt das Flow-Matching-Paradigma und ein Set-Transformer-inspiriertes Design, um Abhängigkeiten innerhalb von Säcken zu erfassen und kohärente, semantisch konsistente Repräsentationen zu generieren.

machine-learning-models Multiple Instance Learning representation learning Generative AI

ARTICLEDEV.to AI·5/1/2026

Universal representations:The missing link between faces, text, planktons, andcat breeds

Dieser Inhalt befasst sich mit dem Konzept universeller Repräsentationen in der KI und schlägt sie als das fehlende Glied zur Verbindung und Verarbeitung äußerst unterschiedlicher Datentypen vor. Ziel ist es, einen einheitlichen Rahmen zu schaffen, der von menschlichen Gesichtern und Text bis hin zu Plankton und Katzenrassen alles verstehen kann.

AI models multimodal AI universal representations representation learning

RESEARCHarXiv CS.LG·4/13/2026

Silhouette Loss: Differentiable Global Structure Learning for Deep Representations

Dieses Paper stellt den Soft Silhouette Loss vor, ein neuartiges differenzierbares Lernziel für Deep Learning, inspiriert vom klassischen Silhouettenkoeffizienten. Er zielt darauf ab, diskriminative Repräsentationen zu lernen, indem er intra-Klassen-Kompaktheit und inter-Klassen-Trennung effizienter als bestehende Metrik-Lernansätze durchsetzt.

Classification metric learning deep learning loss functions

RESEARCHarXiv CS.LG·5/8/2026

Data-Driven Variational Basis Learning Beyond Neural Networks: A Non-Neural Framework for Adaptive Basis Discovery

Dieses Manuskript stellt das Data Driven Variational Basis Learning (DVBL) vor, ein neuartiges nicht-neuronales Framework zum Lernen von datenadaptiven Basisfunktionen direkt aus hochdimensionalen Daten. Es bietet eine explizite, interpretierbare und mathematisch transparente Alternative zu neuronalen Netzen für das Repräsentationslernen, die deren Einschränkungen in Bezug auf Kontrolle und Transparenz adressiert.

variational methods Optimization machine learning data science

RESEARCHarXiv CS.LG·4/13/2026

Distilling Genomic Models for Efficient mRNA Representation Learning via Embedding Matching

Dieses Papier stellt ein Destillations-Framework vor, um große genomische Grundlagenmodelle für das mRNA-Repräsentationslernen effizienter zu gestalten und die Modellgröße um das 200-fache zu reduzieren. Durch die Verwendung von Embedding-Level-Destillation erreicht das kleinere Modell bei mRNA-bezogenen Aufgaben eine hochmoderne Leistung und demonstriert damit eine effektive Strategie für skalierbare biologische KI.

mRNA Foundation Models Model Distillation representation learning

RESEARCHarXiv CS.CL·4/10/2026

Enabling Intrinsic Reasoning over Dense Geospatial Embeddings with DFR-Gemma

O conteúdo descreve o DFR-Gemma, um novo framework que permite que LLMs raciocinem diretamente sobre embeddings geoespaciais densos. Ele alinha embeddings de alta dimensão com o espaço latente de um LLM através de um projetor leve, injetando-os como tokens semânticos.

Geospatial AI LLMs Geospatial Embeddings Spatio-temporal Data

RESEARCHarXiv CS.CL·5/5/2026

H-Probes: Extracting Hierarchical Structures From Latent Representations of Language Models

Diese Arbeit stellt H-Probes vor, lineare Sonden zur Extraktion hierarchischer Strukturen, insbesondere Tiefe und paarweiser Abstand, aus latenten Repräsentationen großer Sprachmodelle. Die Forschung zeigt, dass diese Sonden robust niederdimensionale Unterräume finden, die für die Leistung bei synthetischen Baumdurchlaufaufgaben entscheidend sind und gut innerhalb sowie außerhalb des Bereichs generalisieren.

language models hierarchical reasoning representation learning AI Research

RESEARCHarXiv CS.LG·4/16/2026

The Long Delay to Arithmetic Generalization: When Learned Representations Outrun Behavior

Diese Forschung untersucht das Phänomen des „Grokking“ in Transformatoren und stellt fest, dass die lange Verzögerung bei der Generalisierung in arithmetischen Modellen auf einen Decoder-Engpass zurückzuführen ist. Der Encoder erwirbt relevantes Strukturwissen frühzeitig, doch der Decoder hat Schwierigkeiten, darauf zuzugreifen, eine Hypothese, die durch kausale Interventionen wie das Transplantieren von Encodern gestützt wird.

grokking machine learning representation learning Transformers

RESEARCHarXiv CS.LG·vor 26T

A Unified Geometric Framework for Weighted Contrastive Learning

Kontrastives Lernen zielt darauf ab, relationale Strukturen zwischen Samples zu erhalten, indem Repräsentationen gelernt werden, die einen Ähnlichkeitsgraphen widerspiegeln. Dieses Papier interpretiert gewichtete InfoNCE-Ziele als Distanzgeometrie-Probleme und bietet einen einheitlichen geometrischen Rahmen sowie exakte Charakterisierungen optimaler Einbettungen, wobei aufgezeigt wird, wie Klassenasymmetrie die Ähnlichkeiten zwischen Klassen in SupCon beeinflusst.

neural networks contrastive learning machine learning geometry

RESEARCHarXiv CS.LG·5/7/2026

Transformation Categorization Based on Group Decomposition Theory Using Parameter Division

Diese Forschung untersucht die unbeaufsichtigte Kategorisierung von Transformationen zwischen Eingabepaaren unter Verwendung algebraischer Einschränkungen, um ein prinzipielles Verständnis guter Repräsentationen zu erlangen. Sie schlägt die Parameterdivision vor, um frühere Galois-theoretische Methoden zu verfeinern, indem deren Abhängigkeit von Hilfsannahmen behoben und die Zerlegung von Gruppen verbessert wird.

neural networks algebra group theory representation learning

RESEARCHarXiv CS.LG·vor 12T

Emergent Semantic Representations in World Models through Physical Interaction without Linguistic Supervision

Diese Forschung untersucht, wie Weltmodelle semantische Repräsentationen durch physische Erkundung ohne linguistische Supervision lernen. Es wird festgestellt, dass ihr latenter Raum eine räumliche semantische Struktur entwickelt, die die physische Geometrie widerspiegelt, wobei die semantische Ausrichtung mit der Vorhersageleistung mitverbessert wird.

machine learning World Models embodied AI representation learning

RESEARCHarXiv CS.LG·vor 13T

Tackling Multimodal Learning Challenges with Mixture-of-Expert: A Survey

Dieser Artikel präsentiert eine Umfrage, die Herausforderungen des multimodalen Lernens mit der Mixture-of-Experts (MoE)-Architektur behandelt. Die Studie untersucht, wie MoE als effizienter Motor und Repräsentationslerner zur Integration verschiedener Datenmodalitäten fungiert. Sie schließt eine Lücke in der Literatur, indem sie eine umfassende und systematische Übersicht zu diesem Thema bietet.

multimodal learning Survey Mixture of Experts AI