← heapsort-ai

deep learning

263 items

RESEARCHarXiv CS.LG·hace 8d

BitsMoE: Efficient Spectral Energy-Guided Bit Allocation for MoE LLM Quantization

BitsMoE propone un marco de asignación de bits guiado por energía espectral para la cuantificación de modelos de lenguaje grandes de Mixture-of-Experts (MoE). Aborda el despliegue intensivo en memoria descomponiendo las capas MoE y utilizando factores espectrales específicos del experto para una cuantificación de precisión mixta y detallada.

27
ARTICLEDEV.to AI·11/4/2026

CNN Layer Composition — A Practical Developer Guide to Activation, Pooling, and Fully Connected Layers

Esta guía práctica detalla la composición de las capas de una CNN, explicando cómo las capas de activación, pooling y totalmente conectadas trabajan juntas para transformar mapas de características en predicciones. Enfatiza la importancia de la no linealidad, introducida por funciones como ReLU, para el aprendizaje de características complejas y el funcionamiento de la red.

27
DOCDEV.to AI·1/5/2026

🏈 TensorCraft Playbook: De CNNs de Sala de Aula a Cloud TPUs com Keras

Este contenido describe los componentes fundamentales de una arquitectura de Red Neuronal Convolucional (CNN), detallando la extracción de características con Conv2D, la reducción espacial con MaxPooling2D, la regularización con Dropout y la clasificación con capas densas. Se centra en el diseño de una estructura equilibrada para la extracción jerárquica de patrones espaciales en imágenes.

27
DOCDEV.to AI·hace 20d

AI Tesla FSDWaymo

Esta guía completa explora el cambio de la conducción autónoma modular a la de extremo a extremo, comparando diferentes arquitecturas como las de Tesla FSD V12 y Waymo. Detalla los pros y contras de cada enfoque, incluyendo soluciones híbridas y grandes modelos multimodales.

27
RESEARCHDEV.to AI·hace 15d

François Chollet 谈 AGI 未来

François Chollet discute el futuro de la AGI, prediciendo su llegada alrededor de 2030, y presenta la misión del laboratorio NDI de desarrollar un nuevo paradigma de aprendizaje automático "óptimo" basado en la síntesis de programas simbólicos. Critica las limitaciones del aprendizaje profundo y describe la estrategia de alto riesgo y alta recompensa de NDI para el avance fundamental de la IA.

27
RESEARCHarXiv CS.CL·7/4/2026

MultiPress: A Multi-Agent Framework for Interpretable Multimodal News Classification

Este artigo propõe o MultiPress, uma estrutura inovadora de múltiplos agentes em três estágios para a classificação de notícias multimodais, visando superar as limitações de métodos existentes na compreensão de dados heterogêneos como texto e imagens. A pesquisa integra agentes especializados para percepção, raciocínio aumentado por recuperação e fusão, demonstrando melhorias significativas em um novo conjunto de dados em grande escala.

27
ARTICLEDEV.to AI·1/5/2026

I Built an AI That Detects Pneumonia From Chest X-Rays Here's Exactly How I Did It

El autor construyó y lanzó "PneumoScan AI", un modelo de deep learning que detecta neumonía en radiografías de tórax con más del 90% de precisión, con el objetivo de acelerar el diagnóstico en áreas de bajos recursos. Este artículo detalla el proceso de desarrollo, incluyendo el uso de un conjunto de datos de Kaggle y el descubrimiento de su desequilibrio.

27