deep learning

263 items

RESEARCHDEV.to AI·21/4/2026

Multi-Objective Deep Reinforcement Learning

Este contenido explora el campo del Aprendizaje Profundo por Refuerzo Multiobjetivo. Probablemente profundiza en técnicas para entrenar agentes de IA para optimizar múltiples criterios de rendimiento simultáneamente.

Optimization deep learning reinforcement learning

ARTICLEDEV.to AI·26/4/2026

Your Transformer is Secretly Linear

Este artículo explora la idea de que, a pesar de su complejidad, los modelos Transformer pueden exhibir propiedades lineales o ser equivalentes a ellos en ciertos aspectos. La discusión profundiza en la naturaleza fundamental de estos modelos de IA y sus implicaciones.

neural networks deep learning machine learning AI

DOCDEV.to AI·28/4/2026

Building a No-Install AI Upscaler: Leveraging Cloud GPUs for Seamless Image Processing

GoHard AI Upscaler es una herramienta basada en navegador para la mejora de imágenes de nivel profesional, eliminando la necesidad de equipos locales de alta gama. Logra una instalación cero y un rendimiento constante utilizando Python, modelos de IA optimizados y GPUs en la nube de Google Colab.

Image processing deep learning cloud computing machine learning

DOCHugging Face Blog·hace 12d

Profiling in PyTorch (Part 1): A Beginner's Guide to torch.profiler

Este artículo es una guía para principiantes sobre el uso de `torch.profiler` para el análisis de rendimiento en PyTorch. Explica cómo perfilar eficazmente modelos de aprendizaje profundo para identificar cuellos de botella y optimizar la ejecución.

deep learning learning profiling performance

RESEARCHarXiv CS.LG·30/4/2026

RaMP: Runtime-Aware Megakernel Polymorphism for Mixture-of-Experts

RaMP es un framework de despacho consciente del enrutamiento que optimiza la inferencia de Mixture-of-Experts (MoE), abordando la pérdida de rendimiento del 10-70% de los sistemas actuales. Utiliza un análisis de región de rendimiento y un modelo de costo de onda para seleccionar configuraciones óptimas del kernel, logrando hasta 1.22x de aceleración y solo un 0.93% de error promedio.

deep learning AI optimization performance

RESEARCHarXiv CS.AI·6/5/2026

Virtual Speech Therapist: A Clinician-in-the-Loop AI Speech Therapy Agent for Personalized and Supervised Therapy

Este artículo desarrolla el Virtual Speech Therapist (VST), una plataforma basada en agentes inteligentes para la evaluación de la tartamudez y la terapia personalizada mediante flujos de trabajo impulsados por IA. VST combina clasificación de tartamudez por deep learning y razonamiento de LLM multiagente para crear y perfeccionar planes de terapia, con un agente crítico que asegura la seguridad clínica y el cumplimiento de las directrices.

deep learning AI in healthcare speech therapy stuttering

RESEARCHarXiv CS.AI·8/4/2026

MedGemma 1.5 Technical Report

O MedGemma 1.5 4B é um novo modelo que expande as capacidades do MedGemma 1, integrando análise de imagens médicas de alta dimensão (CT/MRI, histopatologia), localização anatômica e compreensão de documentos médicos. Ele demonstra ganhos significativos em precisão de classificação de condições em MRI e CT, e um aumento de 47% no macro F1 para imagens de patologia de lâmina inteira.

deep learning AI healthcare AI Medical Imaging

RESEARCHarXiv CS.LG·6/4/2026

Convolutional Surrogate for 3D Discrete Fracture-Matrix Tensor Upscaling

Este estudo aborda o alto custo computacional da modelagem de fluxo de água subterrânea em meios fraturados usando simulações DFM. Para otimizar o processo, propõe-se um modelo substituto baseado em rede neural convolucional 3D para prever a condutividade hidráulica equivalente, permitindo um framework Monte Carlo multinível mais eficiente.

Simulação Numérica Modelos Substitutos Modelagem Hidrogeológica Monte Carlo

RESEARCHarXiv CS.CL·6/4/2026

CIPHER: Conformer-based Inference of Phonemes from High-density EEG

CIPHER é um modelo baseado em Conformer para inferência de fonemas a partir de EEG de alta densidade, visando decodificar informações de fala do cérebro. Embora alcance alta performance em tarefas binárias, mostra desempenho limitado na discriminação de fonemas de 11 classes, sendo posicionado como um estudo de benchmark e comparação de características.

deep learning speech decoding brain-computer interface machine learning

RESEARCHarXiv CS.CL·hace 28d

jina-embeddings-v5-omni: Geometry-preserving Embeddings via Locked Aligned Towers

Este trabajo presenta GELATO, un enfoque novedoso para modelos de embedding multimodales que extiende las arquitecturas de estilo VLM. Da como resultado la suite jina-embeddings-v5-omni, que codifica eficientemente texto, imagen, audio y video en un único espacio de embedding semántico al congelar los modelos de texto base y entrenar solo los componentes de conexión.

embedding models multimodal AI deep learning machine learning

ARTICLEML Mastery·hace 10d

Serving Multiple Users at Once: How Continuous Batching Keeps LLM Inference Efficient

Este artículo explora cómo el procesamiento por lotes continuo mejora la eficiencia de la inferencia de LLMs, abordando los problemas del procesamiento por lotes estático. Detalla la programación dinámica y el procesamiento por lotes irregular para procesar múltiples solicitudes simultáneamente.

inference deep learning efficiency Batching

Serving Multiple Users at Once: How Continuous Batching Keeps LLM Inference Efficient

ARTICLELangChain Blog·hace 20d

Interpreters in Deep Agents: Code Between Tool Calls and Sandboxes

Deep Agents ahora es compatible con intérpretes: pequeños entornos de ejecución incrustados donde los agentes escriben código para coordinar herramientas, mantener el estado de trabajo y decidir qué entra en el contexto del modelo.

deep learning Tool Coordination Runtime Environments Interpreters

Interpreters in Deep Agents: Code Between Tool Calls and Sandboxes

ARTICLEDEV.to AI·22/4/2026

Blog 2: Momentum-Based Optimizers

El contenido del blog trata sobre optimizadores basados en impulso, explorando su función e importancia para acelerar el entrenamiento de modelos de aprendizaje automático. Detalla cómo estos algoritmos mejoran la convergencia y la eficiencia de las redes neuronales.

deep learning machine learning AI Algorithms

RESEARCHDEV.to AI·21/4/2026

Learning to be Safe: Deep RL with a Safety Critic

Este contenido explora un enfoque novedoso para el Aprendizaje por Refuerzo Profundo mediante la integración de un "crítico de seguridad" para prevenir acciones inseguras. La metodología tiene como objetivo mejorar la fiabilidad y robustez de los agentes de IA, haciéndolos aptos para su implementación en el mundo real donde la seguridad es fundamental.

deep learning reinforcement learning security machine learning

DOCGoogle for Developers (YouTube)·30/4/2026

Unlocking Low-Level Control: Customizing Keras Training Loops with JAX

Este contenido aborda cómo obtener control de bajo nivel y personalizar los bucles de entrenamiento de Keras. Detalla la integración con JAX para permitir mayor flexibilidad y rendimiento en el desarrollo de modelos de aprendizaje automático.

Training Loops Keras deep learning machine learning

Unlocking Low-Level Control: Customizing Keras Training Loops with JAX

RESEARCHarXiv CS.LG·17/4/2026

The Devil Is in Gradient Entanglement: Energy-Aware Gradient Coordinator for Robust Generalized Category Discovery

Este trabajo de investigación introduce un Coordinador de Gradiente Consciente de Energía para abordar el "entrelazamiento de gradiente", un desafío clave en la Descubierta Generalizada de Categorías Robusta. El método propuesto tiene como objetivo mejorar la robustez y el rendimiento de los modelos de IA en la identificación de nuevas categorías.

Gradient Descent category discovery deep learning machine learning

RESEARCHarXiv CS.AI·15/4/2026

Identity as Attractor: Geometric Evidence for Persistent Agent Architecture in LLM Activation Space

Este estudio explora la identidad como un atractor en la arquitectura de agentes persistentes en los espacios de activación de LLM. Presenta evidencia geométrica para comprender la estructura subyacente y el comportamiento de los modelos de lenguaje.

AI architecture LLMs deep learning computational geometry

RESEARCHarXiv CS.LG·13/4/2026

Ranked Activation Shift for Post-Hoc Out-of-Distribution Detection

Esta investigación presenta un método llamado Ranked Activation Shift para la detección post-hoc de datos fuera de distribución. Su objetivo es mejorar la identificación de muestras de datos que se desvían de la distribución de entrenamiento.

OOD Detection neural networks deep learning machine learning

ARTICLETwo Minute Papers (YouTube)·28/4/2026

Solved: The Bug That Haunted AI Video For Years

Un error persistente que afectó la tecnología de video con IA durante años ha sido finalmente resuelto. Esta solución representa un avance significativo para la calidad y estabilidad de los sistemas de video basados en inteligencia artificial.

AI video deep learning computer vision bug fix

Solved: The Bug That Haunted AI Video For Years

RESEARCHHugging Face Blog·9/3/2026

Ulysses Sequence Parallelism: Training with Million-Token Contexts

Este conteúdo aborda o paralelismo de sequência Ulysses, uma técnica inovadora para o treinamento de modelos de inteligência artificial. O foco está na capacitação de modelos para processar contextos de milhões de tokens de forma eficiente.

deep learning Long Contexts Training High-Performance Computing