← heapsort-ai

deep learning

263 items

RESEARCHarXiv CS.LG·30/4/2026

RaMP: Runtime-Aware Megakernel Polymorphism for Mixture-of-Experts

RaMP es un framework de despacho consciente del enrutamiento que optimiza la inferencia de Mixture-of-Experts (MoE), abordando la pérdida de rendimiento del 10-70% de los sistemas actuales. Utiliza un análisis de región de rendimiento y un modelo de costo de onda para seleccionar configuraciones óptimas del kernel, logrando hasta 1.22x de aceleración y solo un 0.93% de error promedio.

27
RESEARCHarXiv CS.AI·6/5/2026

Virtual Speech Therapist: A Clinician-in-the-Loop AI Speech Therapy Agent for Personalized and Supervised Therapy

Este artículo desarrolla el Virtual Speech Therapist (VST), una plataforma basada en agentes inteligentes para la evaluación de la tartamudez y la terapia personalizada mediante flujos de trabajo impulsados por IA. VST combina clasificación de tartamudez por deep learning y razonamiento de LLM multiagente para crear y perfeccionar planes de terapia, con un agente crítico que asegura la seguridad clínica y el cumplimiento de las directrices.

27
RESEARCHarXiv CS.AI·8/4/2026

MedGemma 1.5 Technical Report

O MedGemma 1.5 4B é um novo modelo que expande as capacidades do MedGemma 1, integrando análise de imagens médicas de alta dimensão (CT/MRI, histopatologia), localização anatômica e compreensão de documentos médicos. Ele demonstra ganhos significativos em precisão de classificação de condições em MRI e CT, e um aumento de 47% no macro F1 para imagens de patologia de lâmina inteira.

27
RESEARCHarXiv CS.LG·6/4/2026

Convolutional Surrogate for 3D Discrete Fracture-Matrix Tensor Upscaling

Este estudo aborda o alto custo computacional da modelagem de fluxo de água subterrânea em meios fraturados usando simulações DFM. Para otimizar o processo, propõe-se um modelo substituto baseado em rede neural convolucional 3D para prever a condutividade hidráulica equivalente, permitindo um framework Monte Carlo multinível mais eficiente.

27
RESEARCHarXiv CS.CL·6/4/2026

CIPHER: Conformer-based Inference of Phonemes from High-density EEG

CIPHER é um modelo baseado em Conformer para inferência de fonemas a partir de EEG de alta densidade, visando decodificar informações de fala do cérebro. Embora alcance alta performance em tarefas binárias, mostra desempenho limitado na discriminação de fonemas de 11 classes, sendo posicionado como um estudo de benchmark e comparação de características.

27
RESEARCHarXiv CS.CL·hace 28d

jina-embeddings-v5-omni: Geometry-preserving Embeddings via Locked Aligned Towers

Este trabajo presenta GELATO, un enfoque novedoso para modelos de embedding multimodales que extiende las arquitecturas de estilo VLM. Da como resultado la suite jina-embeddings-v5-omni, que codifica eficientemente texto, imagen, audio y video en un único espacio de embedding semántico al congelar los modelos de texto base y entrenar solo los componentes de conexión.

27
ARTICLEDEV.to AI·22/4/2026

Blog 2: Momentum-Based Optimizers

El contenido del blog trata sobre optimizadores basados en impulso, explorando su función e importancia para acelerar el entrenamiento de modelos de aprendizaje automático. Detalla cómo estos algoritmos mejoran la convergencia y la eficiencia de las redes neuronales.

27
RESEARCHarXiv CS.LG·17/4/2026

The Devil Is in Gradient Entanglement: Energy-Aware Gradient Coordinator for Robust Generalized Category Discovery

Este trabajo de investigación introduce un Coordinador de Gradiente Consciente de Energía para abordar el "entrelazamiento de gradiente", un desafío clave en la Descubierta Generalizada de Categorías Robusta. El método propuesto tiene como objetivo mejorar la robustez y el rendimiento de los modelos de IA en la identificación de nuevas categorías.

27