deep learning

263 items

RESEARCHarXiv CS.LG·hace 8d

BitsMoE: Efficient Spectral Energy-Guided Bit Allocation for MoE LLM Quantization

BitsMoE propone un marco de asignación de bits guiado por energía espectral para la cuantificación de modelos de lenguaje grandes de Mixture-of-Experts (MoE). Aborda el despliegue intensivo en memoria descomponiendo las capas MoE y utilizando factores espectrales específicos del experto para una cuantificación de precisión mixta y detallada.

MoE models deep learning AI optimization quantization

ARTICLEDEV.to AI·11/4/2026

CNN Layer Composition — A Practical Developer Guide to Activation, Pooling, and Fully Connected Layers

Esta guía práctica detalla la composición de las capas de una CNN, explicando cómo las capas de activación, pooling y totalmente conectadas trabajan juntas para transformar mapas de características en predicciones. Enfatiza la importancia de la no linealidad, introducida por funciones como ReLU, para el aprendizaje de características complejas y el funcionamiento de la red.

neural networks CNN deep learning Activation Functions

DOCDEV.to AI·hace 12d

Recurrent Neural Networks for Time Series Forecasting

Se exploran las Redes Neuronales Recurrentes para la predicción de series temporales, destacando su capacidad para modelar secuencias de datos. Este contenido detalla cómo funcionan estas arquitecturas y sus aplicaciones prácticas en el campo de la inteligencia artificial.

neural networks forecasting deep learning machine learning

RESEARCHDEV.to AI·hace 17d

Visual Sentiment Prediction with Deep Convolutional Neural Networks

Este artículo se centra en la predicción del sentimiento visual utilizando redes neuronales convolucionales profundas. Explora métodos avanzados para analizar e interpretar emociones en imágenes mediante IA.

neural networks deep learning computer vision sentiment analysis

DOCDEV.to AI·1/5/2026

🏈 TensorCraft Playbook: De CNNs de Sala de Aula a Cloud TPUs com Keras

Este contenido describe los componentes fundamentales de una arquitectura de Red Neuronal Convolucional (CNN), detallando la extracción de características con Conv2D, la reducción espacial con MaxPooling2D, la regularización con Dropout y la clasificación con capas densas. Se centra en el diseño de una estructura equilibrada para la extracción jerárquica de patrones espaciales en imágenes.

neural networks CNN Keras deep learning

RESEARCHDEV.to AI·26/4/2026

Deep Generative Dual Memory Network for Continual Learning

El título "Deep Generative Dual Memory Network for Continual Learning" describe una arquitectura de red neuronal profunda y generativa. Su objetivo es facilitar el aprendizaje continuo, permitiendo que el modelo adquiera nueva información sin olvidar conocimientos previos, mediante un enfoque de doble memoria.

neural networks deep learning Continual Learning Generative AI

RESEARCHDEV.to AI·hace 27d

WebWatcher: Breaking New Frontier of Vision-Language Deep Research Agent

WebWatcher introduce un novedoso agente de investigación profunda de visión-lenguaje, ampliando las fronteras de las capacidades de la IA al integrar la comprensión visual con el procesamiento del lenguaje. Esta investigación explora nuevas fronteras sobre cómo los sistemas de IA pueden percibir e interactuar con información compleja.

deep learning AI agent vision-language AI Research

RESEARCHDEV.to AI·26/4/2026

A Physics-Informed Deep Learning Paradigm for Car-Following Models

Esta investigación presenta un nuevo paradigma de aprendizaje profundo informado por la física para desarrollar modelos de seguimiento de vehículos. El enfoque busca integrar principios físicos fundamentales directamente en redes neuronales profundas para mejorar la precisión y la interpretabilidad de las simulaciones de tráfico.

Traffic Modeling deep learning Autonomous Vehicles simulation

DOCDEV.to AI·hace 20d

AI Tesla FSDWaymo

Esta guía completa explora el cambio de la conducción autónoma modular a la de extremo a extremo, comparando diferentes arquitecturas como las de Tesla FSD V12 y Waymo. Detalla los pros y contras de cada enfoque, incluyendo soluciones híbridas y grandes modelos multimodales.

Waymo deep learning autonomous driving Tesla FSD

DOCML Mastery·hace 13d

The Statistics of Token Selection: Logits, Temperature, and Top-P Walkthrough

Este contenido explica el proceso de selección de tokens en grandes modelos de lenguaje (LLMs). Detalla cómo criterios como logits, temperatura y top-p influyen en la coherencia y la creatividad de las salidas generadas.

LLMs Token Selection deep learning machine learning

The Statistics of Token Selection: Logits, Temperature, and Top-P Walkthrough

ARTICLEDEV.to AI·24/4/2026

Layer Normalization — Deep Dive + Problem: Largest Connected Region

Este contenido ofrece una inmersión profunda en la Normalización de Capas, un componente crucial de la Arquitectura Transformer. Detalla su importancia para estabilizar el entrenamiento y mejorar el rendimiento de los Large Language Models (LLMs), originándose del artículo "Attention is All You Need".

Transformer Architecture LLMs deep learning NLP

RESEARCHDEV.to AI·hace 15d

François Chollet 谈 AGI 未来

François Chollet discute el futuro de la AGI, prediciendo su llegada alrededor de 2030, y presenta la misión del laboratorio NDI de desarrollar un nuevo paradigma de aprendizaje automático "óptimo" basado en la síntesis de programas simbólicos. Critica las limitaciones del aprendizaje profundo y describe la estrategia de alto riesgo y alta recompensa de NDI para el avance fundamental de la IA.

AGI deep learning Symbolic AI Benchmarks

DOCDEV.to AI·3/5/2026

DeepRobust: A PyTorch Library for Adversarial Attacks and Defenses

DeepRobust es una biblioteca de PyTorch diseñada para la investigación y el desarrollo de ataques y defensas adversarias. Ofrece herramientas para probar la robustez de los modelos de aprendizaje profundo contra manipulaciones maliciosas.

deep learning security machine learning adversarial AI

RESEARCHDEV.to AI·24/4/2026

Two-Stream 3D Convolutional Neural Network for Skeleton-Based Action Recognition

Este contenido describe una red neuronal convolucional 3D de doble flujo para el reconocimiento de acciones basado en esqueletos.

neural networks deep learning computer vision Action Recognition

RESEARCHarXiv CS.CL·7/4/2026

MultiPress: A Multi-Agent Framework for Interpretable Multimodal News Classification

Este artigo propõe o MultiPress, uma estrutura inovadora de múltiplos agentes em três estágios para a classificação de notícias multimodais, visando superar as limitações de métodos existentes na compreensão de dados heterogêneos como texto e imagens. A pesquisa integra agentes especializados para percepção, raciocínio aumentado por recuperação e fusão, demonstrando melhorias significativas em um novo conjunto de dados em grande escala.

news classification deep learning multimodal classification multi-agent systems

ARTICLEDEV.to AI·1/5/2026

Gemini 3.1 Flash TTS: the next generation of expressive AI speech

Gemini 3.1 Flash TTS representa un avance significativo en la síntesis de voz expresiva y humana, empleando modelado de prosodia avanzado y conciencia contextual. El sistema logra además una latencia ultrarrápida, casi en tiempo real.

deep learning AI Text-to-Speech

RESEARCHDEV.to AI·hace 26d

Recent Advances in Object Detection in the Age of Deep Convolutional NeuralNetworks

Este contenido analiza los avances recientes en la detección de objetos, centrándose específicamente en el papel y el impacto de las redes neuronales convolucionales profundas. Probablemente explora nuevas técnicas, modelos y desafíos dentro de este campo de la inteligencia artificial.

deep learning object detection computer vision Convolutional Neural Networks

RESEARCHDEV.to AI·4/5/2026

Tensor Programs II: Neural Tangent Kernel for Any Architecture

Esta investigación explora "Tensor Programs II", centrándose en extender el Neural Tangent Kernel (NTK) para que sea aplicable a cualquier arquitectura de red neuronal. Busca proporcionar un marco unificado para comprender y analizar el límite de ancho infinito de las redes neuronales.

Neural Tangent Kernel deep learning Tensor Programs machine learning

ARTICLEDEV.to AI·1/5/2026

I Built an AI That Detects Pneumonia From Chest X-Rays Here's Exactly How I Did It

El autor construyó y lanzó "PneumoScan AI", un modelo de deep learning que detecta neumonía en radiografías de tórax con más del 90% de precisión, con el objetivo de acelerar el diagnóstico en áreas de bajos recursos. Este artículo detalla el proceso de desarrollo, incluyendo el uso de un conjunto de datos de Kaggle y el descubrimiento de su desequilibrio.

deep learning pneumonia detection healthcare AI Medical Imaging

RESEARCHDEV.to AI·hace 24d

MobileVLM V2: Faster and Stronger Baseline for Vision Language Model

MobileVLM V2 presenta una línea de base nueva y mejorada para modelos de lenguaje visual, centrándose en un rendimiento más rápido y capacidades más robustas. Esta investigación tiene como objetivo mejorar la eficiencia y la solidez de los VLM en plataformas móviles.

AI models Vision-Language Models research deep learning