← heapsort-ai

deep learning

263 items

RESEARCHarXiv CS.LG·vor 7T

BitsMoE: Efficient Spectral Energy-Guided Bit Allocation for MoE LLM Quantization

BitsMoE schlägt ein spektralenergiegesteuertes Bit-Allokations-Framework für die Quantisierung von Mixture-of-Experts (MoE) Large Language Models vor. Es zielt darauf ab, den speicherintensiven Einsatz durch die Zerlegung von MoE-Schichten und die Verwendung experten-spezifischer Spektralfaktoren für eine fein abgestufte gemischte Präzisionsquantisierung zu reduzieren.

27
ARTICLEDEV.to AI·4/11/2026

CNN Layer Composition — A Practical Developer Guide to Activation, Pooling, and Fully Connected Layers

Dieser praktische Leitfaden erläutert den Aufbau von CNN-Schichten und erklärt, wie Aktivierungs-, Pooling- und vollständig verbundene Schichten zusammenarbeiten, um Feature Maps in Vorhersagen umzuwandeln. Er betont die entscheidende Rolle der Nichtlinearität, die durch Funktionen wie ReLU eingeführt wird, für das Lernen komplexer Merkmale und den effektiven Betrieb des Netzwerks.

27
DOCDEV.to AI·5/1/2026

🏈 TensorCraft Playbook: De CNNs de Sala de Aula a Cloud TPUs com Keras

Dieser Inhalt beschreibt die grundlegenden Komponenten einer Convolutional Neural Network (CNN)-Architektur, die Merkmalsextraktion mit Conv2D, räumliche Reduktion mit MaxPooling2D, Regularisierung mit Dropout und Klassifizierung mit dichten Schichten detailliert darstellt. Er konzentriert sich auf das Design einer ausgewogenen Struktur zur hierarchischen Extraktion räumlicher Muster in Bildern.

27
DOCDEV.to AI·vor 20T

AI Tesla FSDWaymo

Dieser umfassende Leitfaden beleuchtet den Übergang vom modularen zum End-to-End autonomen Fahren und vergleicht verschiedene Architekturen wie Tesla FSD V12 und Waymo. Er beschreibt die Vor- und Nachteile jedes Ansatzes, einschließlich hybrider Lösungen und multimodaler großer Modelle.

27
RESEARCHDEV.to AI·vor 15T

François Chollet 谈 AGI 未来

François Chollet erörtert die Zukunft der AGI, deren Ankunft er um 2030 prognostiziert, und stellt die Mission des NDI-Labors vor, ein neues, "optimales" maschinelles Lernparadigma basierend auf symbolischer Programmsynthese zu entwickeln. Er kritisiert die Grenzen des Deep Learning und skizziert die risikoreiche, aber potenziell hoch lohnende Strategie von NDI für grundlegende KI-Fortschritte.

27
RESEARCHarXiv CS.CL·4/7/2026

MultiPress: A Multi-Agent Framework for Interpretable Multimodal News Classification

Este artigo propõe o MultiPress, uma estrutura inovadora de múltiplos agentes em três estágios para a classificação de notícias multimodais, visando superar as limitações de métodos existentes na compreensão de dados heterogêneos como texto e imagens. A pesquisa integra agentes especializados para percepção, raciocínio aumentado por recuperação e fusão, demonstrando melhorias significativas em um novo conjunto de dados em grande escala.

27
ARTICLEDEV.to AI·5/1/2026

I Built an AI That Detects Pneumonia From Chest X-Rays Here's Exactly How I Did It

Der Autor entwickelte und startete "PneumoScan AI", ein Deep-Learning-Modell, das Lungenentzündung auf Röntgenbildern des Brustkorbs mit über 90% Genauigkeit erkennt, um die Diagnose in ressourcenarmen Gebieten zu beschleunigen. Der Artikel beschreibt den Entwicklungsprozess, einschließlich der Nutzung eines Kaggle-Datensatzes und der Entdeckung seines Ungleichgewichts.

27