deep learning

263 items

RESEARCHDEV.to AI·03/05/2026

On Complex Valued Convolutional Neural Networks

Ce contenu aborde les Réseaux Neuronaux Convolutifs à Valeurs Complexes, explorant leur théorie, leur architecture et leurs avantages potentiels dans le traitement des signaux et des images. Il examine comment ces réseaux peuvent capturer des relations de phase et d'amplitude que les réseaux à valeurs réelles pourraient manquer.

deep learning Convolutional Neural Networks Complex Valued Networks AI Research

DOCDEV.to AI·il y a 9j

Pytorch for Neural Networks Part 2: Initializing Weights and Biases

Cet article, partie d'une série, détaille comment initialiser les poids et les biais dans une classe de réseau neuronal PyTorch. Il démontre l'utilisation de "nn.Parameter" pour définir un poids, permettant à PyTorch de le traiter comme un composant optimisable du réseau.

neural networks deep learning learning Weights and Biases

DOCDEV.to AI·03/05/2026

Writing the Loss Function

Ce document explore l'importance et l'implémentation des fonctions de perte, éléments cruciaux pour l'entraînement efficace des modèles d'apprentissage automatique. Il détaille comment formuler et appliquer différents types de fonctions de perte pour optimiser les performances des algorithmes d'IA.

deep learning Loss Function machine learning AI development

RESEARCHDEV.to AI·il y a 27j

Geometry of Optimization and Implicit Regularization in Deep Learning

Ce contenu explore la géométrie de l'optimisation et de la régularisation implicite dans les réseaux de neurones profonds. Il examine comment les caractéristiques intrinsèques des algorithmes d'optimisation influencent le comportement et la généralisation des modèles d'apprentissage profond.

Optimization deep learning machine learning regularization

ARTICLEDEV.to AI·25/04/2026

DeepSeek V4's Real Innovation Isn't Scale—It's Memory Architecture

La véritable innovation de DeepSeek V4 réside dans son architecture mémoire, et non seulement dans son échelle, rendant son contexte de 1M de tokens réellement utilisable. Grâce à des techniques de compression du cache KV comme CSA et HCA, il réduit la consommation de mémoire de près de 9 fois, surmontant les défis pratiques des modèles à long contexte.

AI models LLMs deep learning Memory Optimization

RESEARCHDEV.to AI·il y a 26j

Directed Graph Convolutional Network

Les réseaux convolutifs de graphes dirigés (DGCN) sont un type spécialisé de réseau neuronal conçu pour traiter des données structurées sous forme de graphes dirigés. Ils étendent les GCN traditionnels en capturant efficacement les informations directionnelles et les relations au sein de structures de réseau complexes.

deep learning Convolutional Networks Graph Neural Networks machine learning

RESEARCHDEV.to AI·il y a 20j

AI/ML Research Digest — May 16, 2026

Les récentes avancées en recherche IA/ML améliorent considérablement l'efficacité des modèles et la vitesse d'inférence dans diverses applications. Des techniques telles que la distillation de connaissances avec des adaptateurs de faible rang, une distillation en-politique améliorée, l'optimiseur Pion et les méthodes d'élagage-puis-distillation réduisent les coûts de calcul et permettent un déploiement plus large des modèles d'IA avancés.

deep learning machine learning AI Efficiency video generation

ARTICLEDEV.to AI·24/04/2026

Why My First Convolutional Neural Network Kept Overfitting (And How I Fixed It)

Cet article raconte l'expérience de l'auteur avec le surapprentissage dans son premier réseau de neurones convolutifs pour la classification d'images, où une grande précision d'entraînement contrastait avec de faibles résultats de validation. Il vise à expliquer comment identifier et résoudre le surapprentissage, offrant des conseils pratiques pour éviter les frustrations courantes.

deep learning image classification machine learning Convolutional Neural Networks

NEWSGoogle DeepMind Blog·27/04/2026

Announcing our partnership with the Republic of Korea

Google DeepMind et la République de Corée annoncent un partenariat pour accélérer les découvertes scientifiques. Cette collaboration vise à utiliser des modèles d'IA de pointe pour stimuler des avancées significatives.

deep learning government-collaboration Partnerships artificial intelligence

Announcing our partnership with the Republic of Korea

DOCDEV.to AI·il y a 27j

Transformer Neural Network Architecture Diagram — A Visual Guide for Engineers

Ce guide visuel explique l'architecture du réseau neuronal Transformer, couvrant le mécanisme d'attention et la structure encodeur-décodeur. Il démontre comment les Transformers ont surpassé les modèles RNN précédents en introduisant le traitement parallèle et l'auto-attention, devenant la base des LLM modernes comme BERT et GPT.

neural networks deep learning learning Transformer

RESEARCHDEV.to AI·05/05/2026

Robust Invisible Video Watermarking with Attention

Cette recherche présente une nouvelle méthode robuste de tatouage vidéo invisible qui utilise des mécanismes d'attention pour améliorer l'imperceptibilité et la résilience aux attaques.

robustness video watermarking deep learning security

RESEARCHDEV.to AI·10/05/2026

Learning Deep Latent Spaces for Multi-Label Classification

Cette recherche explore des méthodes pour apprendre des espaces latents profonds afin d'améliorer la classification multi-étiquettes. Elle vise à représenter les données dans un espace significatif de dimension inférieure pour une précision et une efficacité accrues.

Multi-label Classification deep learning learning machine learning

DOCDEV.to AI·il y a 26j

How to scale distributed deep learning?

Ce contenu explore les méthodes et stratégies pour la mise à l'échelle efficace des modèles d'apprentissage profond distribué. Il couvre diverses techniques et meilleures pratiques pour optimiser les performances et l'efficacité des déploiements d'IA à grande échelle.

deep learning machine learning distributed systems scaling

DOCHugging Face (YouTube)·il y a 7j

What Are Tensors?

Ce contenu explique ce que sont les tenseurs, une structure de données fondamentale utilisée en algèbre linéaire et en intelligence artificielle. Il détaille leur importance et leur application dans les modèles d'apprentissage automatique.

tensors deep learning learning machine learning

ARTICLEDEV.to AI·11/04/2026

Output Layer Explained — Logits, Softmax, Cross-Entropy, and Why They Work Together

Cet article explique comment les réseaux neuronaux génèrent des prédictions significatives via des probabilités, détaillant la fonction des logits, de la softmax et de l'entropie croisée. Il aborde la manière dont ces composants transforment les sorties brutes en distributions de probabilité interprétables et comment la fonction de perte mesure la précision, assurant la stabilité numérique.

neural networks Logits softmax Cross-Entropy

RESEARCHDEV.to AI·il y a 10j

PyRep: Bringing V-REP to Deep Robot Learning

PyRep est présenté comme une boîte à outils conçue pour faciliter l'apprentissage profond des robots en fournissant une interface entre le simulateur de robotique V-REP et les frameworks populaires d'apprentissage profond. Il vise à rationaliser le développement et les tests d'applications robotiques basées sur l'IA dans un environnement simulé.

PyRep deep learning AI simulation

RESEARCHDEV.to AI·26/04/2026

Transformer-Transducer: End-to-End Speech Recognition with Self-Attention

Ce contenu décrit le modèle Transformer-Transducer, une nouvelle architecture pour la reconnaissance vocale de bout en bout qui utilise le mécanisme d'auto-attention des Transformers. Il vise à améliorer la précision et l'efficacité de la transcription du langage parlé directement en texte.

deep learning Transformer Speech Recognition

ARTICLEDEV.to AI·25/04/2026

No More Pesky Learning Rate Guessing Games

Ce contenu aborde la fin des difficultés liées à la devinette du taux d'apprentissage dans les modèles d'IA, suggérant une solution ou une méthode d'optimisation. Il vise à simplifier le processus d'entraînement des réseaux neuronaux.

neural networks Optimization deep learning machine learning

RESEARCHDEV.to AI·il y a 26j

Episodic Exploration for Deep Deterministic Policies: An Application toStarCraft Micromanagement Tasks

Cet article de recherche introduit des techniques d'exploration épisodique appliquées aux politiques déterministes profondes. Il se concentre sur l'amélioration des performances de l'IA dans les tâches complexes de microgestion de StarCraft.

Episodic Exploration deep learning reinforcement learning Game AI

ARTICLEDEV.to AI·il y a 22j

Learning to Optimize Neural Nets

Cet article explore les méthodes d'optimisation des réseaux neuronaux, en se concentrant sur les techniques qui améliorent leurs performances et leur efficacité. Il aborde les approches d'apprentissage pour améliorer les algorithmes sous-jacents régissant l'entraînement des modèles d'IA.

neural networks Optimization deep learning machine learning