deep learning

263 items

ARTICLEHugging Face (YouTube)·16/04/2026

RoPE: Understanding Rotary Positional Embeddings in transformers

Ce contenu explore les Plongements Positionnels Rotatifs (RoPE) utilisés dans les architectures de transformateurs. Il vise à approfondir la compréhension du fonctionnement de RoPE et de son importance dans la modélisation de séquences.

RoPE AI models Positional Embeddings deep learning

RoPE: Understanding Rotary Positional Embeddings in transformers

DOCDeepLearning.AI (YouTube)·23/03/2026

Natural Language Processing Specialization by DeepLearning.AI

La Spécialisation en Traitement du Langage Naturel de DeepLearning.AI propose un parcours d'apprentissage complet pour développer des compétences en PNL. Le cours couvre des techniques avancées et des applications pratiques dans le domaine de l'intelligence artificielle.

deep learning learning NLP AI education

Natural Language Processing Specialization by DeepLearning.AI

RESEARCHQwen Blog·05/03/2025

QwQ-32B: Embracing the Power of Reinforcement Learning

O conteúdo aborda o potencial do Aprendizado por Reforço (RL) em escala para aprimorar o desempenho e as capacidades de raciocínio de modelos de IA, superando métodos convencionais. A pesquisa explora especificamente o impacto do RL na inteligência de Grandes Modelos de Linguagem (LLMs), citando exemplos como o DeepSeek R1.

model performance deep learning reinforcement learning large language models

DOCAndrej Karpathy (YouTube)·12/09/2022

Building makemore Part 2: MLP

Ce contenu est la deuxième partie d'une série sur la construction du modèle 'makemore', se concentrant spécifiquement sur l'implémentation d'un Réseau de Neurones Perceptron Multicouche (MLP). Il sert de tutoriel pour comprendre et construire les composants fondamentaux des modèles de langage.

neural networks MLP deep learning learning

DOCAndrej Karpathy (YouTube)·11/10/2022

Building makemore Part 4: Becoming a Backprop Ninja

Cet article est la quatrième partie de la série "Building makemore", se concentrant sur une compréhension approfondie de la rétropropagation. Il vise à transformer le lecteur en un "Ninja de la Rétropropagation" en couvrant les aspects techniques essentiels pour le développement de modèles d'IA.

neural networks deep learning learning backpropagation

Building makemore Part 4: Becoming a Backprop Ninja

DOCStatQuest (YouTube)·12/02/2025

StatQuest on DeepLearning.AI!!! Check out my short course on attention!

StatQuest a lancé un cours court sur les mécanismes d'attention sur la plateforme DeepLearning.AI. Le cours vise à enseigner les fondamentaux et les applications de cette technique importante d'intelligence artificielle.

deep learning learning attention mechanisms

StatQuest on DeepLearning.AI!!! Check out my short course on attention!

DOCTowards Data Science·03/02/2025

Image Captioning Paper Walkthrough: Show and Tell

Ce contenu traite de l'implémentation de l'un des premiers modèles neuronaux de génération de légendes d'images à l'aide de la bibliothèque PyTorch.

neural networks deep learning learning PyTorch

DOCAndrej Karpathy (YouTube)·04/10/2022

Building makemore Part 3: Activations & Gradients, BatchNorm

Ce contenu, 'Building makemore Partie 3', explore des concepts avancés de réseaux neuronaux essentiels à l'entraînement de modèles. Il aborde spécifiquement les activations, les gradients et l'application de BatchNorm pour une stabilité et des performances améliorées.

neural networks model building deep learning learning

Building makemore Part 3: Activations & Gradients, BatchNorm

DOCWeights & Biases·21/10/2019

Neural Network Fundamentals

Ce contenu aborde les principes fondamentaux des réseaux neuronaux, expliquant leurs composants et leur fonctionnement de base. Il constitue une introduction essentielle pour quiconque souhaite comprendre la base de l'intelligence artificielle.

neural networks deep learning machine learning AI

DOCWeights & Biases·05/12/2019

Walking through Neural Style Transfer with Weights & Biases

Ce contenu propose un tutoriel pratique sur le Transfert de Style Neuronal, détaillant comment implémenter cette technique. Il explore l'utilisation de la bibliothèque Weights & Biases pour surveiller et gérer les expériences d'apprentissage automatique. Ce guide est idéal pour ceux qui souhaitent apprendre à appliquer la stylisation artistique aux images.

neural style transfer deep learning learning computer vision

ARTICLEThe AI Epiphany (YouTube)·31/07/2024

LLaMA 3 Deep Dive! (Thomas Scialom - Meta)

Ce contenu propose une analyse approfondie de LLaMA 3, le modèle de langage étendu avancé de Meta. Il présente les éclairages de Thomas Scialom, une figure clé de Meta, offrant une exploration détaillée de son architecture, de ses capacités et de ses applications potentielles.

deep learning Llama 3 Meta Generative AI

LLaMA 3 Deep Dive! (Thomas Scialom - Meta)

RESEARCHYannic Kilcher (YouTube)·01/11/2025

[Paper Analysis] The Free Transformer (and some Variational Autoencoder stuff)

Ce contenu propose une analyse approfondie d'un article sur "The Free Transformer" et les concepts liés aux Variational Autoencoders. Il explore des aspects techniques avancés des architectures de modèles d'IA.

AI models deep learning Transformer Variational Autoencoder

[Paper Analysis] The Free Transformer (and some Variational Autoencoder stuff)

RESEARCHWeights & Biases·05/11/2019

Exploring Deep Learning Hyperparameters with Random Forests

Ce contenu explore des méthodes pour optimiser les modèles d'apprentissage profond en étudiant leurs hyperparamètres. Il utilise spécifiquement les capacités des forêts aléatoires pour analyser et affiner systématiquement ces paramètres critiques.

Random Forests deep learning Hyperparameters Machine Learning Optimization

ARTICLEDEV.to AI·11/04/2026

The 3 Waves of Deep Learning (Why AI Took Decades to Actually Work)

L'article décrit les trois vagues du Deep Learning, expliquant pourquoi l'IA a mis des décennies à fonctionner en abordant des limitations comme le problème XOR. Il détaille l'évolution du Perceptron au Deep Learning moderne, soulignant le rôle de la rétropropagation et des réseaux multicouches.

Perceptron deep learning backpropagation História da IA

ARTICLEDEV.to AI·26/04/2026

Cross-Modal Knowledge Distillation for deep-sea exploration habitat design under multi-jurisdictional compliance

Cet article propose d'appliquer la Distillation de Connaissances Cross-Modales (CMKD) pour la conception d'habitats d'exploration en eaux profondes. Cette technique vise à intégrer des flux de données chaotiques et multi-sources afin de respecter des exigences complexes environnementales, structurelles et légales dans plusieurs juridictions.

multimodal AI Knowledge Distillation deep learning Deep-sea exploration

ARTICLE↑ trendingReddit r/MachineLearning·09/04/2026

AI Systems Performance Engineering by Chris Fregly - is it worth it? [D]

O usuário busca recomendações de livros para aprender sobre otimização e alto desempenho em Machine Learning e Deep Learning. Ele compara dois títulos: 'AI Systems Performance Engineering' e 'Machine Learning Systems'.

Book Recommendation deep learning Machine Learning Optimization AI performance

ARTICLEDEV.to AI·15/04/2026

Affordable GPU Cloud Options for AI Development

Cet article aborde le coût élevé des GPU pour le développement de l'IA, proposant des options de GPU cloud abordables comme solution. Il souligne pourquoi les GPU sont essentiels pour l'entraînement et l'inférence des modèles d'IA modernes grâce à leurs capacités de traitement parallèle.

cost-effective AI deep learning cloud computing GPU Cloud

ARTICLEHugging Face Blog·03/03/2026

PRX Part 3 — Training a Text-to-Image Model in 24h!

Este é o terceiro episódio da série PRX, focado no desafio de treinar um modelo de inteligência artificial capaz de gerar imagens a partir de descrições textuais. O artigo propõe explorar como essa tarefa complexa pode ser realizada em um período otimizado de 24 horas.

Text-to-image deep learning model training machine learning

ARTICLEDEV.to AI·11/04/2026

Spatial Behavior of Convolution in CNNs (Stride, Padding, and Feature Maps Explained)

Ce guide explore comment la convolution, le stride, le padding et les cartes de caractéristiques contrôlent le comportement spatial dans les Réseaux de Neurones Convolutifs (CNNs). Il souligne que les CNNs sont des systèmes de transformation spatiale, où des filtres appliqués génèrent des cartes de caractéristiques avec invariance translationnelle et efficacité des paramètres.

CNNs Convolution deep learning

ARTICLEDEV.to AI·11/04/2026

The Business Impact of Generative AI Tools

L'IA Générative est une technologie transformatrice qui stimule l'innovation et l'efficacité des entreprises en produisant du contenu de haute qualité. Basée sur des architectures avancées de deep learning comme les transformers, elle est intégrée aux flux de travail d'entreprise via des API.

enterprise technology deep learning business impact Generative AI