← heapsort-ai

representation learning

23 items

RESEARCHarXiv CS.LG·il y a 1j

Principles and Practice of Deep Representation Learning: or a Mathematical Theory of Memory

Ce livre vise à démystifier les grands réseaux profonds et les modèles génératifs, souvent perçus comme des "boîtes noires", en explorant leurs mécanismes internes à travers la perspective de l'apprentissage de représentations. Il décrit les principes de conception des architectures de réseaux neuronaux modernes, en utilisant l'optimisation et la théorie de l'information.

60
RESEARCH↑ trendingReddit r/MachineLearning·30/04/2026

[R] Joint Embedding Variational Bayes (TMLR ’26)

Cet article de TMLR introduit la sémantique variationnelle opérationnelle dans les architectures d'embedding conjoint pour l'apprentissage de représentations non contrastives. Il y parvient en factorisant la vraisemblance d'embedding, en ancrant l'incertitude postérieure à l'échelle de la vraisemblance et en utilisant une vraisemblance de Student-t à queue lourde pour des avantages empiriques.

42
ARTICLEDEV.to AI·22/04/2026

Autoencoders and Representation Learning in Vision

Les auto-encodeurs sont des réseaux neuronaux qui compressent les données dans un espace de dimension inférieure et les reconstruisent, apprenant des structures non linéaires contrairement à l'ACP linéaire. Leur conception en deux étapes comprend un encodeur qui projette les données d'entrée dans un espace latent pour extraire des caractéristiques informatives.

31
ARTICLEDEV.to AI·11/04/2026

Sparse Federated Representation Learning for deep-sea exploration habitat design for low-power autonomous deployments

L'auteur explore l'apprentissage fédéré pour surmonter les défis de latence des données volumineuses de capteurs de véhicules autonomes multi-robotiques, visant à optimiser le traitement dans des environnements à faible bande passante. Cette approche recherche une alternative distribuée à la synchronisation centralisée des données, via des mises à jour de modèles distribués.

29
RESEARCHarXiv CS.AI·il y a 27j

Don't Look at the Numbers: Visual Anchoring Bias and Layer-wise Representation in VLMs

Cet article de recherche démontre que les ancres numériques intégrées aux images biaisent systématiquement les jugements de qualité des Modèles Vision-Langage (VLMs). Le sondage couche par couche révèle que les couches optimales pour la prédiction de qualité sont plus profondes que celles où la classification de l'ancre sature, établissant une explication causale du biais d'ancrage visuel.

29
RESEARCHarXiv CS.LG·il y a 5j

Bayes-Sufficient Representations in Supervised Learning

Ce travail définit les représentations Bayes-suffisantes pour l'apprentissage supervisé, se concentrant sur l'information pertinente pour la prédiction basée sur un problème de décision et une fonction de perte fixes. Il introduit le concept de quotient de Bayes et relie le cadre à l'élicitation de propriétés, montrant comment différentes fonctions de perte exigent des actions Bayes-optimales spécifiques.

28
RESEARCHarXiv CS.LG·21/04/2026

SetFlow: Generating Structured Sets of Representations for Multiple Instance Learning

Ce travail introduit SetFlow, une architecture générative qui modélise des sacs entiers de données d'apprentissage par instances multiples (MIL) directement dans l'espace de représentation. Il utilise le paradigme de flow matching et une conception inspirée de Set Transformer pour capturer les dépendances intra-sac et générer des représentations cohérentes et sémantiquement consistantes.

27
RESEARCHarXiv CS.LG·13/04/2026

Silhouette Loss: Differentiable Global Structure Learning for Deep Representations

Cet article présente la Soft Silhouette Loss, une nouvelle fonction de perte différentiable pour l'apprentissage profond, inspirée du coefficient de silhouette classique. Elle vise à apprendre des représentations discriminatives en favorisant la compacité intra-classe et la séparation inter-classes de manière plus efficace que les méthodes existantes.

27
RESEARCHarXiv CS.LG·08/05/2026

Data-Driven Variational Basis Learning Beyond Neural Networks: A Non-Neural Framework for Adaptive Basis Discovery

Ce manuscrit présente le Data Driven Variational Basis Learning (DVBL), un nouveau cadre non neuronal pour l'apprentissage de fonctions de base adaptatives aux données directement à partir de données de haute dimension. Il offre une alternative explicite, interprétable et mathématiquement transparente aux réseaux neuronaux pour l'apprentissage de représentations, abordant leurs limites en matière de contrôle et de transparence.

27
RESEARCHarXiv CS.LG·13/04/2026

Distilling Genomic Models for Efficient mRNA Representation Learning via Embedding Matching

Cet article présente un cadre de distillation visant à rendre plus efficaces les grands modèles de fondation génomiques pour l'apprentissage de la représentation de l'ARNm. En réduisant la taille du modèle par 200 grâce à la distillation au niveau des embeddings, le modèle plus petit atteint des performances de pointe sur les tâches liées à l'ARNm, soulignant une stratégie efficace pour l'IA biologique évolutive.

27
RESEARCHarXiv CS.CL·05/05/2026

H-Probes: Extracting Hierarchical Structures From Latent Representations of Language Models

Cet article introduit les H-probes, des sondes linéaires conçues pour extraire la structure hiérarchique, notamment la profondeur et la distance par paire, des représentations latentes des grands modèles de langage. La recherche montre que ces sondes identifient de manière robuste des sous-espaces de faible dimension essentiels à la performance dans les tâches de parcours d'arbres synthétiques, avec une bonne généralisation intra et inter-domaines.

27
RESEARCHarXiv CS.LG·16/04/2026

The Long Delay to Arithmetic Generalization: When Learned Representations Outrun Behavior

Cette recherche examine le phénomène de 'grokking' dans les transformateurs, constatant que le long délai de généralisation dans les modèles arithmétiques résulte d'un goulot d'étranglement du décodeur. L'encodeur acquiert rapidement des connaissances structurelles pertinentes, mais le décodeur peine à y accéder, une hypothèse étayée par des interventions causales telles que la transplantation d'encodeurs.

27
RESEARCHarXiv CS.LG·il y a 25j

A Unified Geometric Framework for Weighted Contrastive Learning

L'apprentissage contrastif vise à préserver la structure relationnelle entre les échantillons en apprenant des représentations qui reflètent un graphe de similarité. Cet article interprète les objectifs InfoNCE pondérés comme des problèmes de géométrie de distance, offrant un cadre géométrique unifié et des caractérisations exactes des embeddings optimaux, révélant comment le déséquilibre des classes affecte les similarités inter-classes dans SupCon.

27
RESEARCHarXiv CS.LG·07/05/2026

Transformation Categorization Based on Group Decomposition Theory Using Parameter Division

Cette recherche explore la catégorisation non supervisée des transformations entre paires d'entrées en utilisant des contraintes algébriques, visant une compréhension fondamentale des bonnes représentations. Elle propose la division des paramètres pour affiner les méthodes galois-théoriques antérieures, en abordant leur dépendance aux hypothèses auxiliaires et en améliorant la décomposition des groupes.

27
RESEARCHarXiv CS.LG·il y a 11j

Emergent Semantic Representations in World Models through Physical Interaction without Linguistic Supervision

Cette recherche explore comment les modèles du monde apprennent des représentations sémantiques à partir de l'exploration physique sans supervision linguistique. Elle révèle que leur espace latent développe une structure sémantique spatiale qui reflète la géométrie physique, et l'alignement sémantique s'améliore avec les performances de prédiction.

27
RESEARCHarXiv CS.LG·il y a 12j

Tackling Multimodal Learning Challenges with Mixture-of-Expert: A Survey

Cet article présente une étude qui aborde les défis de l'apprentissage multimodal avec l'architecture Mixture-of-Experts (MoE). L'étude explore comment le MoE fonctionne comme un moteur efficace et un apprenant de représentations pour intégrer diverses modalités de données. Elle comble une lacune dans la littérature en offrant une revue systématique et complète sur le sujet.

27