deep learning

263 items

RESEARCHDEV.to AI·23/04/2026

Survey of Dropout Methods for Deep Neural Networks

Ce contenu propose une étude approfondie des différentes méthodes de dropout utilisées dans les réseaux de neurones profonds. Il explore comment ces techniques de régularisation aident à prévenir le surapprentissage et à améliorer la généralisation des modèles d'IA.

neural networks deep learning machine learning regularization

ARTICLE↑ trendingReddit r/MachineLearning·19/04/2026

What are the future prospects of Spiking Neural Networks (and particularly, neuromorphics computing) and Liquid Neural Networks? [D]

Un étudiant de premier cycle s'interroge sur les perspectives d'avenir et l'adoption des Réseaux Neuronaux Spiking et des Réseaux Neuronaux Liquides, se demandant si ce sont des domaines prometteurs pour l'apprentissage et les projets. L'utilisateur souhaite discuter du potentiel de ces technologies de calcul neuromorphique.

Spiking Neural Networks deep learning Liquid Neural Networks Neuromorphic Computing

ARTICLE↑ trendingReddit r/MachineLearning·13/04/2026

Implementation details of Backpropagation in Siamese networks. [D]

L'utilisateur demande des précisions sur l'implémentation correcte de la rétropropagation dans les réseaux siamois, comparant une approche d'entrée séquentielle à une méthode de type bi-encodeur impliquant l'agrégation des poids. Il cherche à savoir quelle implémentation est la bonne.

implementation details neural networks deep learning siamese networks

ARTICLE↑ trendingReddit r/MachineLearning·17/04/2026

Which computer should I buy: Mac or custom-built 5090? [D]

L'utilisateur demande conseil pour choisir entre un Mac M5 MAX avec MLX et un PC personnalisé avec une RTX 5090 pour ses projets d'apprentissage automatique. Son travail implique principalement le réglage fin de grands modèles pré-entraînés et l'entraînement à partir de zéro, souvent avec des données image/vidéo et, parfois, des LLM, faisant de la VRAM un facteur critique.

deep learning GPU machine learning hardware

NEWS↑ trendingReddit r/MachineLearning·12/04/2026

"There's a new generation of empirical deep learning researchers, hacking away at whatever seems trendy, blowing with the wind" [D]

Le contenu critique la nouvelle génération de chercheurs en deep learning pour suivre les tendances. L'auteur cherche à discuter du terme complexe « IA post-agentique », avec lequel il rencontre des difficultés.

AI trends deep learning post-agentic AI AI concepts

RESEARCHarXiv CS.LG·20/04/2026

M3R: Localized Rainfall Nowcasting with Meteorology-Informed MultiModal Attention

M3R est une nouvelle architecture d'IA pour la prévision immédiate des précipitations qui intègre des images radar visuelles et des données numériques de stations météorologiques via un mécanisme d'attention multimodale. Elle utilise les séries chronologiques des stations météorologiques comme requêtes pour se concentrer sélectivement sur les caractéristiques spatiales du radar, démontrant une performance améliorée dans les prévisions localisées.

nowcasting multimodal AI deep learning AI

RESEARCHarXiv CS.LG·20/04/2026

Dispatch-Aware Ragged Attention for Pruned Vision Transformers

Cet article examine le goulot d'étranglement lié à la surcharge de dispatch qui empêche l'élagage de tokens de réduire efficacement la latence dans les Vision Transformers (ViTs). Il propose un nouveau noyau d'attention Triton léger qui abaisse ce seuil de dispatch, améliorant ainsi le débit global jusqu'à 2.24x pour les ViTs élagués.

AI models deep learning Performance optimization attention mechanisms

RESEARCHarXiv CS.CL·22/04/2026

Model-Agnostic Meta Learning for Class Imbalance Adaptation

Cet article présente Hardness-Aware Meta-Resample (HAMR), un cadre unifié qui s'adapte aux déséquilibres de classes et à la difficulté des données dans les tâches de PNL. HAMR utilise des optimisations à deux niveaux et un mécanisme de rééchantillonnage conscient du voisinage pour prioriser les échantillons véritablement difficiles et les classes minoritaires, démontrant des améliorations substantielles sur divers ensembles de données déséquilibrés.

Meta-Learning deep learning machine learning Natural Language Processing

RESEARCHarXiv CS.LG·22/04/2026

Multi-Level Temporal Graph Networks with Local-Global Fusion for Industrial Fault Diagnosis

Cet article propose un réseau de graphes temporel multi-niveaux avec fusion de caractéristiques local-global pour le diagnostic des pannes industrielles. Il aborde les relations complexes entre les capteurs en construisant dynamiquement des graphes de corrélation et en combinant des encodeurs basés sur LSTM pour les caractéristiques temporelles avec des couches de convolution de graphes pour les dépendances spatiales.

fault diagnosis industrial AI deep learning Graph Neural Networks

RESEARCHDEV.to AI·il y a 2j

Development and Validation of Deep Learning Algorithms for Detection of CriticalFindings in Head CT Scans

Ce contenu traite du développement et de la validation d'algorithmes d'apprentissage profond conçus pour détecter les résultats critiques dans les scanners cérébraux. La recherche explore l'application de l'intelligence artificielle pour améliorer la détection dans les diagnostics médicaux.

deep learning diagnostic imaging CT scans healthcare AI

DOCDEV.to AI·il y a 4j

<think>

Ce contenu détaille le service Global API, offrant l'accès à 184 modèles d'IA avec des tarifs compétitifs, comme DeepSeek V4 Flash à 0.25 $/M et GPT-4o. Il met en avant des fonctionnalités telles qu'un SLA de 99.9 %, 50 requêtes gratuites par minute et des crédits sans expiration, ainsi que des options de canal Pro pour des besoins avancés.

AI models deep learning cloud services API

ARTICLEDEV.to AI·il y a 3j

Face Recognition: From Traditional to Deep Learning Methods

Ce contenu explore les méthodes de reconnaissance faciale, des approches traditionnelles aux dernières techniques d'apprentissage profond. Il offre un aperçu complet de l'évolution et des technologies utilisées dans ce domaine de l'intelligence artificielle.

deep learning Face Recognition computer vision AI Methods

RESEARCHarXiv CS.LG·16/04/2026

Automated co-design of high-performance thermodynamic cycles via graph-based hierarchical reinforcement learning

Cette étude introduit une approche d'apprentissage par renforcement hiérarchique basée sur les graphes pour la co-conception automatisée de cycles thermodynamiques haute performance. Elle encode les cycles comme des graphes, utilise un substitut de deep learning pour le décodage et un cadre de RL pour l'évolution structurelle et l'optimisation des paramètres.

Energy Systems deep learning reinforcement learning Graph Neural Networks

RESEARCHarXiv CS.LG·16/04/2026

Sparse Goodness: How Selective Measurement Transforms Forward-Forward Learning

Cette recherche étudie et améliore systématiquement l'algorithme Forward-Forward (FF) en redéfinissant sa fonction de bonté locale, qui distingue les données positives des négatives. Elle introduit les concepts de 'top-k goodness' et 'entmax-weighted energy', démontrant des améliorations substantielles de la précision sur des benchmarks comme Fashion-MNIST.

neural networks goodness function Forward-Forward algorithm deep learning

RESEARCHarXiv CS.LG·il y a 5j

Self-Distilled Policy Gradient

Cet article présente le Self-Distilled Policy Gradient (SDPG), un nouveau cadre qui améliore l'apprentissage par renforcement à récompense clairsemée grâce à l'autodistillation on-policy. Le SDPG intègre des avantages de vérificateur relatifs au groupe, une autodistillation exacte du vocabulaire complet et une régularisation KL, démontrant une stabilité et des performances améliorées par rapport aux références existantes.

language models deep learning reinforcement learning Policy Gradient

ARTICLEDEV.to AI·22/04/2026

Autoencoders and Representation Learning in Vision

Les auto-encodeurs sont des réseaux neuronaux qui compressent les données dans un espace de dimension inférieure et les reconstruisent, apprenant des structures non linéaires contrairement à l'ACP linéaire. Leur conception en deux étapes comprend un encodeur qui projette les données d'entrée dans un espace latent pour extraire des caractéristiques informatives.

neural networks deep learning autoencoders machine learning

ARTICLEDEV.to AI·11/04/2026

A Review of Sparse Expert Models in Deep Learning

Ce contenu analyse les Modèles d'Experts Épars en Deep Learning, une architecture fondamentale pour l'évolutivité et l'efficacité des grands réseaux neuronaux. La revue explore leur application et leur impact dans le domaine de l'intelligence artificielle avancée.

neural networks deep learning Sparse Models AI Architectures

RESEARCHDEV.to AI·il y a 3j

Exponentially Faster Language Modelling

Ce contenu aborde des méthodes pour accélérer significativement l'entraînement et l'inférence des modèles linguistiques. Il explore de nouvelles architectures ou optimisations algorithmiques pour améliorer l'efficacité.

deep learning Natural Language Processing AI language modelling

RESEARCHarXiv CS.CL·il y a 4j

Predict and Reconstruct: Joint Objectives for Self-Supervised Language Representation Learning

Cet article propose un objectif de pré-entraînement hybride pour les encodeurs de texte, combinant une perte de prédiction d'espace latent de type JEPA avec un objectif standard de modélisation de langage masqué (MLM). Cette approche vise à encourager des représentations ancrées dans une structure sémantique plus profonde plutôt que dans la simple identité des tokens de surface, démontrant des embeddings significativement plus uniformes.

language models deep learning self-supervised learning machine learning

RESEARCHDEV.to AI·il y a 3j

Aligning where to see and what to tell: image caption with region-basedattention and scene factorization

Ce travail présente une méthode de génération de légendes d'images, utilisant l'attention basée sur les régions et la factorisation de scène pour améliorer la pertinence et la précision descriptive. Il vise à aligner plus efficacement la perception visuelle avec la narration textuelle.

scene understanding deep learning computer vision attention mechanisms