← heapsort-ai

deep learning

263 items

ARTICLE↑ trendingReddit r/MachineLearning·19/04/2026

What are the future prospects of Spiking Neural Networks (and particularly, neuromorphics computing) and Liquid Neural Networks? [D]

Un étudiant de premier cycle s'interroge sur les perspectives d'avenir et l'adoption des Réseaux Neuronaux Spiking et des Réseaux Neuronaux Liquides, se demandant si ce sont des domaines prometteurs pour l'apprentissage et les projets. L'utilisateur souhaite discuter du potentiel de ces technologies de calcul neuromorphique.

38
ARTICLE↑ trendingReddit r/MachineLearning·17/04/2026

Which computer should I buy: Mac or custom-built 5090? [D]

L'utilisateur demande conseil pour choisir entre un Mac M5 MAX avec MLX et un PC personnalisé avec une RTX 5090 pour ses projets d'apprentissage automatique. Son travail implique principalement le réglage fin de grands modèles pré-entraînés et l'entraînement à partir de zéro, souvent avec des données image/vidéo et, parfois, des LLM, faisant de la VRAM un facteur critique.

36
RESEARCHarXiv CS.LG·20/04/2026

M3R: Localized Rainfall Nowcasting with Meteorology-Informed MultiModal Attention

M3R est une nouvelle architecture d'IA pour la prévision immédiate des précipitations qui intègre des images radar visuelles et des données numériques de stations météorologiques via un mécanisme d'attention multimodale. Elle utilise les séries chronologiques des stations météorologiques comme requêtes pour se concentrer sélectivement sur les caractéristiques spatiales du radar, démontrant une performance améliorée dans les prévisions localisées.

35
RESEARCHarXiv CS.LG·20/04/2026

Dispatch-Aware Ragged Attention for Pruned Vision Transformers

Cet article examine le goulot d'étranglement lié à la surcharge de dispatch qui empêche l'élagage de tokens de réduire efficacement la latence dans les Vision Transformers (ViTs). Il propose un nouveau noyau d'attention Triton léger qui abaisse ce seuil de dispatch, améliorant ainsi le débit global jusqu'à 2.24x pour les ViTs élagués.

35
RESEARCHarXiv CS.CL·22/04/2026

Model-Agnostic Meta Learning for Class Imbalance Adaptation

Cet article présente Hardness-Aware Meta-Resample (HAMR), un cadre unifié qui s'adapte aux déséquilibres de classes et à la difficulté des données dans les tâches de PNL. HAMR utilise des optimisations à deux niveaux et un mécanisme de rééchantillonnage conscient du voisinage pour prioriser les échantillons véritablement difficiles et les classes minoritaires, démontrant des améliorations substantielles sur divers ensembles de données déséquilibrés.

35
RESEARCHarXiv CS.LG·22/04/2026

Multi-Level Temporal Graph Networks with Local-Global Fusion for Industrial Fault Diagnosis

Cet article propose un réseau de graphes temporel multi-niveaux avec fusion de caractéristiques local-global pour le diagnostic des pannes industrielles. Il aborde les relations complexes entre les capteurs en construisant dynamiquement des graphes de corrélation et en combinant des encodeurs basés sur LSTM pour les caractéristiques temporelles avec des couches de convolution de graphes pour les dépendances spatiales.

35
DOCDEV.to AI·il y a 4j

<think>

Ce contenu détaille le service Global API, offrant l'accès à 184 modèles d'IA avec des tarifs compétitifs, comme DeepSeek V4 Flash à 0.25 $/M et GPT-4o. Il met en avant des fonctionnalités telles qu'un SLA de 99.9 %, 50 requêtes gratuites par minute et des crédits sans expiration, ainsi que des options de canal Pro pour des besoins avancés.

33
RESEARCHarXiv CS.LG·16/04/2026

Automated co-design of high-performance thermodynamic cycles via graph-based hierarchical reinforcement learning

Cette étude introduit une approche d'apprentissage par renforcement hiérarchique basée sur les graphes pour la co-conception automatisée de cycles thermodynamiques haute performance. Elle encode les cycles comme des graphes, utilise un substitut de deep learning pour le décodage et un cadre de RL pour l'évolution structurelle et l'optimisation des paramètres.

31
RESEARCHarXiv CS.LG·16/04/2026

Sparse Goodness: How Selective Measurement Transforms Forward-Forward Learning

Cette recherche étudie et améliore systématiquement l'algorithme Forward-Forward (FF) en redéfinissant sa fonction de bonté locale, qui distingue les données positives des négatives. Elle introduit les concepts de 'top-k goodness' et 'entmax-weighted energy', démontrant des améliorations substantielles de la précision sur des benchmarks comme Fashion-MNIST.

31
RESEARCHarXiv CS.LG·il y a 5j

Self-Distilled Policy Gradient

Cet article présente le Self-Distilled Policy Gradient (SDPG), un nouveau cadre qui améliore l'apprentissage par renforcement à récompense clairsemée grâce à l'autodistillation on-policy. Le SDPG intègre des avantages de vérificateur relatifs au groupe, une autodistillation exacte du vocabulaire complet et une régularisation KL, démontrant une stabilité et des performances améliorées par rapport aux références existantes.

31
ARTICLEDEV.to AI·22/04/2026

Autoencoders and Representation Learning in Vision

Les auto-encodeurs sont des réseaux neuronaux qui compressent les données dans un espace de dimension inférieure et les reconstruisent, apprenant des structures non linéaires contrairement à l'ACP linéaire. Leur conception en deux étapes comprend un encodeur qui projette les données d'entrée dans un espace latent pour extraire des caractéristiques informatives.

31
RESEARCHarXiv CS.CL·il y a 4j

Predict and Reconstruct: Joint Objectives for Self-Supervised Language Representation Learning

Cet article propose un objectif de pré-entraînement hybride pour les encodeurs de texte, combinant une perte de prédiction d'espace latent de type JEPA avec un objectif standard de modélisation de langage masqué (MLM). Cette approche vise à encourager des représentations ancrées dans une structure sémantique plus profonde plutôt que dans la simple identité des tokens de surface, démontrant des embeddings significativement plus uniformes.

30