← heapsort-ai

deep learning

263 items

DOCAndrej Karpathy (YouTube)·12/09/2022

Building makemore Part 2: MLP

Ce contenu est la deuxième partie d'une série sur la construction du modèle 'makemore', se concentrant spécifiquement sur l'implémentation d'un Réseau de Neurones Perceptron Multicouche (MLP). Il sert de tutoriel pour comprendre et construire les composants fondamentaux des modèles de langage.

Building makemore Part 2: MLP
27
DOCWeights & Biases·05/12/2019

Walking through Neural Style Transfer with Weights & Biases

Ce contenu propose un tutoriel pratique sur le Transfert de Style Neuronal, détaillant comment implémenter cette technique. Il explore l'utilisation de la bibliothèque Weights & Biases pour surveiller et gérer les expériences d'apprentissage automatique. Ce guide est idéal pour ceux qui souhaitent apprendre à appliquer la stylisation artistique aux images.

27
ARTICLEThe AI Epiphany (YouTube)·31/07/2024

LLaMA 3 Deep Dive! (Thomas Scialom - Meta)

Ce contenu propose une analyse approfondie de LLaMA 3, le modèle de langage étendu avancé de Meta. Il présente les éclairages de Thomas Scialom, une figure clé de Meta, offrant une exploration détaillée de son architecture, de ses capacités et de ses applications potentielles.

LLaMA 3 Deep Dive! (Thomas Scialom - Meta)
27
ARTICLEDEV.to AI·26/04/2026

Cross-Modal Knowledge Distillation for deep-sea exploration habitat design under multi-jurisdictional compliance

Cet article propose d'appliquer la Distillation de Connaissances Cross-Modales (CMKD) pour la conception d'habitats d'exploration en eaux profondes. Cette technique vise à intégrer des flux de données chaotiques et multi-sources afin de respecter des exigences complexes environnementales, structurelles et légales dans plusieurs juridictions.

26
ARTICLEDEV.to AI·11/04/2026

Spatial Behavior of Convolution in CNNs (Stride, Padding, and Feature Maps Explained)

Ce guide explore comment la convolution, le stride, le padding et les cartes de caractéristiques contrôlent le comportement spatial dans les Réseaux de Neurones Convolutifs (CNNs). Il souligne que les CNNs sont des systèmes de transformation spatiale, où des filtres appliqués génèrent des cartes de caractéristiques avec invariance translationnelle et efficacité des paramètres.

23