← heapsort-ai

deep learning

263 items

RESEARCHarXiv CS.LG·il y a 7j

BitsMoE: Efficient Spectral Energy-Guided Bit Allocation for MoE LLM Quantization

BitsMoE propose un cadre d'allocation de bits guidé par l'énergie spectrale pour la quantification des grands modèles de langage Mixture-of-Experts (MoE). Il vise à réduire la consommation de mémoire en décomposant les couches MoE et en utilisant des facteurs spectraux spécifiques aux experts pour une quantification à précision mixte et fine.

27
ARTICLEDEV.to AI·11/04/2026

CNN Layer Composition — A Practical Developer Guide to Activation, Pooling, and Fully Connected Layers

Ce guide pratique détaille la composition des couches d'un CNN, expliquant comment l'activation, le pooling et les couches entièrement connectées transforment les cartes de caractéristiques en prédictions. Il souligne l'importance de la non-linéarité, introduite par des fonctions comme ReLU, pour l'apprentissage de caractéristiques complexes et le fonctionnement du réseau.

27
DOCDEV.to AI·01/05/2026

🏈 TensorCraft Playbook: De CNNs de Sala de Aula a Cloud TPUs com Keras

Ce contenu décrit les composants fondamentaux d'une architecture de Réseau Neuronal Convolutif (CNN), détaillant l'extraction de caractéristiques avec Conv2D, la réduction spatiale avec MaxPooling2D, la régularisation avec Dropout et la classification avec des couches denses. Il se concentre sur la conception d'une structure équilibrée pour l'extraction hiérarchique de motifs spatiaux dans les images.

27
RESEARCHDEV.to AI·26/04/2026

A Physics-Informed Deep Learning Paradigm for Car-Following Models

Cette recherche introduit un nouveau paradigme d'apprentissage profond informé par la physique pour développer des modèles de suivi de véhicules. L'approche vise à intégrer des principes physiques fondamentaux directement dans des réseaux neuronaux profonds afin d'améliorer la précision et l'interprétabilité des simulations de trafic.

27
DOCDEV.to AI·il y a 20j

AI Tesla FSDWaymo

Ce guide complet explore le passage de la conduite autonome modulaire à celle de bout en bout, comparant différentes architectures comme Tesla FSD V12 et Waymo. Il détaille les avantages et inconvénients de chaque approche, y compris les solutions hybrides et les grands modèles multimodaux.

27
RESEARCHDEV.to AI·il y a 15j

François Chollet 谈 AGI 未来

François Chollet discute l'avenir de l'AGI, prévoyant son arrivée vers 2030, et présente la mission du laboratoire NDI de développer un nouveau paradigme d'apprentissage automatique "optimal" basé sur la synthèse de programmes symboliques. Il critique les limitations de l'apprentissage profond et décrit la stratégie à haut risque et haute récompense de NDI pour l'avancement fondamental de l'IA.

27
RESEARCHarXiv CS.CL·07/04/2026

MultiPress: A Multi-Agent Framework for Interpretable Multimodal News Classification

Este artigo propõe o MultiPress, uma estrutura inovadora de múltiplos agentes em três estágios para a classificação de notícias multimodais, visando superar as limitações de métodos existentes na compreensão de dados heterogêneos como texto e imagens. A pesquisa integra agentes especializados para percepção, raciocínio aumentado por recuperação e fusão, demonstrando melhorias significativas em um novo conjunto de dados em grande escala.

27
ARTICLEDEV.to AI·01/05/2026

I Built an AI That Detects Pneumonia From Chest X-Rays Here's Exactly How I Did It

L'auteur a créé et lancé "PneumoScan AI", un modèle de deep learning qui détecte la pneumonie sur les radiographies thoraciques avec plus de 90% de précision, pour améliorer le diagnostic dans les zones à faibles ressources. Cet article raconte le processus de développement, y compris l'utilisation d'un ensemble de données Kaggle et la découverte de son déséquilibre.

27