deep learning

263 items

RESEARCHDEV.to AI·6/5/2026

RAVE: A variational autoencoder for fast and high-quality neural audio synthesis

RAVE introduce un novedoso autoencoder variacional diseñado para la síntesis de audio neuronal rápida y de alta calidad. Este modelo mejora significativamente la eficiencia y la fidelidad en la generación de contenido de audio utilizando técnicas de aprendizaje profundo.

deep learning audio synthesis neural audio Variational Autoencoder

RESEARCHDEV.to AI·hace 21d

Ensemble of Deep Convolutional Neural Networks for Learning to Detect RetinalVessels in Fundus Images

Este artículo de investigación propone un método para detectar vasos sanguíneos de la retina en imágenes de fondo de ojo utilizando un conjunto de Redes Neuronales Convolucionales Profundas. El enfoque busca mejorar la precisión diagnóstica a través del análisis avanzado de imágenes.

ensemble methods deep learning Convolutional Neural Networks Medical Imaging

RESEARCHDEV.to AI·20/4/2026

Stable Video Infinity: Generating Infinite-Length Videos with Error Recycling

Stable Video Infinity presenta una solución innovadora para generar videos de duración infinita, superando el problema de los errores acumulados. Su innovación central es un sofisticado mecanismo de Reciclaje de Errores que previene la degradación visual con el tiempo.

deep learning machine learning AI video generation

ARTICLEDEV.to AI·hace 28d

Multi-Head Attention: Collaborate Instead of Concatenate

Este contenido explora el mecanismo de atención multi-cabeza en modelos de IA, centrándose en la idea de colaboración en lugar de concatenación. Probablemente discute un enfoque alternativo para mejorar la eficiencia o el rendimiento de la atención.

deep learning Attention Mechanism machine learning AI

RESEARCHarXiv CS.LG·hace 14d

Iterative Refinement Neural Operators are Learned Fixed-Point Solvers: A Principled Approach to Spectral Bias Mitigation

Este artículo presenta el Operador Neural de Refinamiento Iterativo (IRNO) para mitigar el sesgo espectral en operadores neuronales, utilizando un módulo de refinamiento aprendido con iteración de punto fijo. IRNO descompone las predicciones en una inicialización gruesa y correcciones residuales sucesivas, demostrando una reducción significativa de errores en sistemas físicos.

deep learning Neural Operators Scientific Computing Iterative Methods

RESEARCHarXiv CS.AI·hace 4d

An interpretable and trustworthy AI framework for large-scale longitudinal structure-pain association studies using data from the Osteoarthritis Initiative (OAI)

Esta investigación desarrolla un marco de IA interpretable que combina la predicción de MOAKS de resonancia magnética basada en aprendizaje profundo con modelado estadístico para estudiar las relaciones estructura-dolor a gran escala utilizando datos de la OAI. Emplea aprendizaje profundo para predecir características de MOAKS a partir de resonancias magnéticas con cuantificación de incertidumbre, y un modelo mixto de clase latente longitudinal para examinar asociaciones entre anomalías estructurales y dolor de rodilla.

deep learning Healthcare Osteoarthritis AI

RESEARCHarXiv CS.CL·hace 4d

Multi-Granularity Reasoning for Natural Language Inference

El artículo propone una novedosa Red de Razonamiento Multigranularidad (MGRN) para la Inferencia del Lenguaje Natural (NLI). Aborda las limitaciones de los modelos basados en transformadores existentes al aprovechar características semánticas jerárquicas para capturar interacciones complejas para un razonamiento efectivo.

deep learning Natural Language Inference machine learning Natural Language Processing

RESEARCHarXiv CS.LG·6/4/2026

From Broad Exploration to Stable Synthesis: Entropy-Guided Optimization for Autoregressive Image Generation

O artigo analisa a interação entre Chain-of-Thought (CoT) e Reinforcement Learning (RL) na geração de imagens a partir de texto (T2I) usando uma análise sistemática baseada em entropia. Ele revela que menor entropia dos tokens de imagem e do CoT textual se correlaciona com melhor qualidade de imagem, propondo a estratégia Entropy-Guided Group Relative Policy Optimization (EG-GRPO) para otimização com base na incerteza.

Optimization deep learning reinforcement learning Text-to-Image Generation

DOCDEV.to AI·17/4/2026

Understanding Transformers Part 9: Stacking Self-Attention Layers

Este artículo explica por qué los valores de autoatención reemplazan las codificaciones posicionales originales, ya que integran información contextual de todas las palabras, aclarando relaciones. Luego introduce el apilamiento de múltiples capas de autoatención, cada una con pesos únicos, para capturar relaciones lingüísticas más complejas dentro de oraciones y párrafos.

neural networks Self-Attention deep learning NLP

RESEARCHDEV.to AI·19/4/2026

F-VLM: Open-Vocabulary Object Detection upon Frozen Vision and Language Models

F-VLM introduce un enfoque novedoso para la detección de objetos de vocabulario abierto, aprovechando eficientemente modelos de visión y lenguaje pre-entrenados y congelados. Este método permite identificar una amplia gama de objetos sin requerir datos de entrenamiento específicos para cada nueva categoría.

Vision-Language Models deep learning object detection computer vision

RESEARCHDEV.to AI·2/5/2026

Deep convolutional recurrent autoencoders for learning low-dimensional featuredynamics of fluid systems

Este contenido trata sobre la aplicación de autoencoders recurrentes convolucionales profundos para aprender la dinámica de características de baja dimensión en sistemas de fluidos.

Dimensionality Reduction fluid dynamics deep learning autoencoders

RESEARCHDEV.to AI·7/5/2026

Stateless scheduler doubles LLM training speed

El ajuste fino de grandes modelos de lenguaje a menudo enfrenta cuellos de botella debido a la asignación rígida de GPU y el paralelismo de pipeline ineficiente. Un nuevo programador sin estado, RoundPipe, optimiza el entrenamiento al despachar dinámicamente las etapas de computación a través de un pool de GPUs, duplicando efectivamente la velocidad de entrenamiento de LLMs.

deep learning machine learning GPU optimization Parallelism

ARTICLEDEV.to AI·hace 27d

Comparing AI Approaches for Trade Promotion Strategies in Automotive

El texto destaca que la "promoción comercial con IA" engloba una gama de enfoques, desde sistemas basados en reglas hasta el aprendizaje profundo. Los fabricantes de automóviles deben evaluar estas metodologías en función de compensaciones como la precisión, la complejidad y la madurez de los datos, de forma similar a la elección de las configuraciones de sensores ADAS.

deep learning automotive machine learning AI

RESEARCHarXiv CS.LG·7/5/2026

Investigating Trustworthiness of Nonparametric Deep Survival Models for Alzheimer's Disease Progression Analysis

Esta investigación explora la fiabilidad y la equidad de los modelos de supervivencia profunda no paramétricos para analizar la progresión de la Enfermedad de Alzheimer (EA). Aborda la falta de estudios que consideren el sesgo aprendido en los modelos de aprendizaje profundo existentes para la EA y propone nuevas métricas de equidad para garantizar predicciones confiables.

deep learning Alzheimer's disease survival analysis medical AI

RESEARCHarXiv CS.LG·hace 6d

Graph Mamba Survival Analysis Based on Topology-Aware ordering

Este artículo aborda desafíos en el análisis de supervivencia de Imágenes de Diapositivas Completas (WSIs), específicamente el cuello de botella computacional de los Transformers y la sensibilidad de Mamba al orden de entrada y su arquitectura unidireccional. Propone un nuevo enfoque para superar las limitaciones de Mamba en la captura de conectividad topológica y estructuras espaciales bidireccionales.

deep learning survival analysis sequence models computational pathology

RESEARCHDEV.to AI·9/5/2026

DeXpression: Deep Convolutional Neural Network for Expression Recognition

DeXpression es un modelo de red neuronal convolucional profunda diseñado para el reconocimiento preciso de expresiones faciales. Su objetivo es mejorar la capacidad de los sistemas de visión por computadora para interpretar emociones humanas a partir de imágenes.

facial expression recognition deep learning computer vision Convolutional Neural Networks

RESEARCHarXiv CS.CL·10/4/2026

Hybrid CNN-Transformer Architecture for Arabic Speech Emotion Recognition

Este artigo apresenta um sistema de Reconhecimento de Emoção da Fala (SER) em árabe, baseado em uma arquitetura híbrida CNN-Transformer. O modelo combina camadas convolucionais para extração de características espectrais e codificadores Transformer para capturar dependências temporais, alcançando 97,8% de precisão e 0,98 de F1-score macro.

CNN deep learning Transformer machine learning

RESEARCHDEV.to AI·hace 13d

MimicMotion: High-Quality Human Motion Video Generation with Confidence-awarePose Guidance

MimicMotion es una investigación centrada en la generación de vídeos de movimiento humano de alta calidad. Este método emplea orientación de pose consciente de la confianza para mejorar los resultados visuales.

deep learning pose guidance AI video generation

RESEARCHarXiv CS.LG·17/4/2026

Awakening Dormant Experts:Counterfactual Routing to Mitigate MoE Hallucinations

Los modelos Mixture-of-Experts (MoE) son propensos a alucinaciones, particularmente con conocimiento de cola larga, debido a que el enrutamiento Top-k estático subprioriza a los expertos especialistas. Se propone el Enrutamiento Contrafactual (CoR), un marco de inferencia sin entrenamiento que utiliza análisis de perturbación y CEI para desplazar dinámicamente los recursos computacionales, despertando así a estos expertos inactivos.

neural networks AI hallucinations deep learning Mixture of Experts

RESEARCHarXiv CS.LG·hace 15d

Reading Calibrated Uncertainty from Language Model Trajectories

Este artículo de investigación propone un nuevo método para cuantificar la incertidumbre en modelos de lenguaje, rastreando la trayectoria acumulativa de las actualizaciones MLP por capa. Al extraer once características geométricas invariantes a escala, una sonda lineal esparsa supera la probabilidad máxima de softmax en la evaluación de la incertidumbre.

language models deep learning Uncertainty Quantification model calibration