deep learning

263 items

RESEARCHDEV.to AI·23/4/2026

Survey of Dropout Methods for Deep Neural Networks

Este contenido presenta un estudio exhaustivo sobre los diversos métodos de dropout utilizados en redes neuronales profundas. Examina cómo estas técnicas de regularización ayudan a prevenir el sobreajuste y a mejorar la capacidad de generalización de los modelos de IA.

neural networks deep learning machine learning regularization

ARTICLE↑ trendingReddit r/MachineLearning·19/4/2026

What are the future prospects of Spiking Neural Networks (and particularly, neuromorphics computing) and Liquid Neural Networks? [D]

Un estudiante universitario pregunta sobre las perspectivas futuras y la adopción de las Redes Neuronales Spiking y las Redes Neuronales Líquidas, cuestionando si son áreas prometedoras para el aprendizaje y proyectos. El usuario busca discutir el potencial de estas tecnologías de computación neuromórfica.

Spiking Neural Networks deep learning Liquid Neural Networks Neuromorphic Computing

ARTICLE↑ trendingReddit r/MachineLearning·13/4/2026

Implementation details of Backpropagation in Siamese networks. [D]

El usuario solicita detalles sobre la implementación correcta de la retropropagación en redes siamesas, comparando un enfoque de entrada secuencial con un método tipo bi-encoder que implica la agregación de pesos. Busca clarificación sobre cuál implementación es precisa.

implementation details neural networks deep learning siamese networks

ARTICLE↑ trendingReddit r/MachineLearning·17/4/2026

Which computer should I buy: Mac or custom-built 5090? [D]

El usuario busca consejo para elegir entre un Mac M5 MAX con MLX y un PC personalizado con una RTX 5090 para sus proyectos de aprendizaje automático. Su trabajo implica principalmente el ajuste fino de grandes modelos pre-entrenados y el entrenamiento desde cero, a menudo con datos de imagen/vídeo y, a veces, LLMs, lo que convierte la VRAM en un factor crítico.

deep learning GPU machine learning hardware

NEWS↑ trendingReddit r/MachineLearning·12/4/2026

"There's a new generation of empirical deep learning researchers, hacking away at whatever seems trendy, blowing with the wind" [D]

El contenido critica a la nueva generación de investigadores de deep learning por seguir tendencias. El autor busca una discusión sobre el complejo término 'IA post-agéntica', con el cual tiene dificultades.

AI trends deep learning post-agentic AI AI concepts

RESEARCHarXiv CS.LG·20/4/2026

M3R: Localized Rainfall Nowcasting with Meteorology-Informed MultiModal Attention

M3R es una nueva arquitectura de IA para la predicción inmediata de lluvias que integra imágenes de radar visuales y datos numéricos de estaciones meteorológicas mediante un mecanismo de atención multimodal. Utiliza series de tiempo de estaciones meteorológicas como consultas para enfocarse selectivamente en características espaciales del radar, demostrando un rendimiento mejorado en la predicción localizada.

nowcasting multimodal AI deep learning AI

RESEARCHarXiv CS.LG·20/4/2026

Dispatch-Aware Ragged Attention for Pruned Vision Transformers

Este artículo analiza el cuello de botella de la sobrecarga de despacho que impide que la poda de tokens reduzca eficazmente la latencia en Vision Transformers (ViTs). Se presenta un nuevo kernel de atención Triton que reduce significativamente esta sobrecarga, logrando hasta 2.24x de rendimiento total para ViTs podados.

AI models deep learning Performance optimization attention mechanisms

RESEARCHarXiv CS.CL·22/4/2026

Model-Agnostic Meta Learning for Class Imbalance Adaptation

Este artículo presenta Hardness-Aware Meta-Resample (HAMR), un marco unificado que aborda la adaptación al desequilibrio de clases y la dificultad de los datos en tareas de PNL. HAMR utiliza optimizaciones de dos niveles y un mecanismo de remuestreo consciente del vecindario para priorizar muestras genuinamente desafiantes y clases minoritarias, logrando mejoras sustanciales en varios conjuntos de datos desequilibrados.

Meta-Learning deep learning machine learning Natural Language Processing

RESEARCHarXiv CS.LG·22/4/2026

Multi-Level Temporal Graph Networks with Local-Global Fusion for Industrial Fault Diagnosis

Este artículo propone una red de grafos temporal multinivel con fusión de características local-global para el diagnóstico de fallas industriales. Aborda las complejas relaciones entre sensores mediante la construcción dinámica de grafos de correlación y la combinación de codificadores basados en LSTM para características temporales con capas de convolución de grafos para dependencias espaciales.

fault diagnosis industrial AI deep learning Graph Neural Networks

RESEARCHDEV.to AI·hace 2d

Development and Validation of Deep Learning Algorithms for Detection of CriticalFindings in Head CT Scans

Este contenido aborda el desarrollo y la validación de algoritmos de aprendizaje profundo diseñados para detectar hallazgos críticos en tomografías computarizadas de cabeza. La investigación explora la aplicación de la inteligencia artificial para mejorar la detección en diagnósticos médicos.

deep learning diagnostic imaging CT scans healthcare AI

DOCDEV.to AI·hace 4d

<think>

Este contenido detalla el servicio Global API, que ofrece acceso a 184 modelos de IA con precios competitivos, como DeepSeek V4 Flash a $0.25/M y GPT-4o. Destaca características como un SLA del 99.9%, 50 solicitudes gratuitas por minuto y créditos que nunca caducan, además de opciones de Canal Pro para necesidades avanzadas.

AI models deep learning cloud services API

ARTICLEDEV.to AI·hace 3d

Face Recognition: From Traditional to Deep Learning Methods

Este contenido explora los métodos de reconocimiento facial, desde enfoques tradicionales hasta las últimas técnicas de aprendizaje profundo. Ofrece una visión integral sobre la evolución y las tecnologías empleadas en este campo de la inteligencia artificial.

deep learning Face Recognition computer vision AI Methods

RESEARCHarXiv CS.LG·16/4/2026

Automated co-design of high-performance thermodynamic cycles via graph-based hierarchical reinforcement learning

Este estudio presenta un enfoque de aprendizaje por refuerzo jerárquico basado en grafos para el codiseño automatizado de ciclos termodinámicos de alto rendimiento. La metodología utiliza redes neuronales profundas para la decodificación y un marco de RL para la evolución estructural y la optimización de parámetros.

Energy Systems deep learning reinforcement learning Graph Neural Networks

RESEARCHarXiv CS.LG·16/4/2026

Sparse Goodness: How Selective Measurement Transforms Forward-Forward Learning

Esta investigación estudia y mejora sistemáticamente el algoritmo Forward-Forward (FF) rediseñando su función de bondad local, que distingue datos positivos de negativos. Introduce 'top-k goodness' y 'entmax-weighted energy', demostrando mejoras sustanciales en la precisión en benchmarks como Fashion-MNIST.

neural networks goodness function Forward-Forward algorithm deep learning

RESEARCHarXiv CS.LG·hace 5d

Self-Distilled Policy Gradient

Este artículo introduce el Self-Distilled Policy Gradient (SDPG), un marco novedoso que mejora el aprendizaje por refuerzo de recompensa dispersa mediante la autodestilación on-policy. SDPG integra ventajas de verificador relativas al grupo, autodestilación exacta de vocabulario completo y regularización KL, demostrando una estabilidad y rendimiento superiores a los métodos base.

language models deep learning reinforcement learning Policy Gradient

ARTICLEDEV.to AI·22/4/2026

Autoencoders and Representation Learning in Vision

Los autoencoders son redes neuronales que comprimen datos en un espacio de menor dimensión y los reconstruyen, aprendiendo estructuras no lineales a diferencia del PCA lineal. Su diseño de dos etapas presenta un codificador que proyecta los datos de entrada en un espacio latente para extraer características informativas.

neural networks deep learning autoencoders machine learning

ARTICLEDEV.to AI·11/4/2026

A Review of Sparse Expert Models in Deep Learning

Este contenido analiza los Modelos de Expertos Escasos en Deep Learning, una arquitectura fundamental para la escalabilidad y eficiencia de grandes redes neuronales. La revisión explora su aplicación e impacto en el campo de la inteligencia artificial avanzada.

neural networks deep learning Sparse Models AI Architectures

RESEARCHDEV.to AI·hace 3d

Exponentially Faster Language Modelling

Este contenido aborda métodos para acelerar significativamente el entrenamiento y la inferencia de modelos de lenguaje. Explora nuevas arquitecturas u optimizaciones algorítmicas para mejorar la eficiencia.

deep learning Natural Language Processing AI language modelling

RESEARCHarXiv CS.CL·hace 4d

Predict and Reconstruct: Joint Objectives for Self-Supervised Language Representation Learning

Este artículo presenta un objetivo de pre-entrenamiento híbrido para codificadores de texto, que combina una pérdida de predicción de espacio latente al estilo JEPA con un objetivo estándar de modelado de lenguaje enmascarado (MLM). Este nuevo enfoque busca fomentar representaciones ancladas en estructuras semánticas más profundas en lugar de solo la identidad superficial de los tokens, mostrando incrustaciones significativamente más uniformes.

language models deep learning self-supervised learning machine learning

RESEARCHDEV.to AI·hace 3d

Aligning where to see and what to tell: image caption with region-basedattention and scene factorization

Este trabajo presenta un método para la generación de subtítulos de imágenes, utilizando atención basada en regiones y factorización de escenas para mejorar la relevancia y precisión descriptiva. Su objetivo es alinear la percepción visual con la narración textual de manera más efectiva.

scene understanding deep learning computer vision attention mechanisms