← heapsort-ai

deep learning

263 items

ARTICLE↑ trendingReddit r/MachineLearning·19/4/2026

What are the future prospects of Spiking Neural Networks (and particularly, neuromorphics computing) and Liquid Neural Networks? [D]

Un estudiante universitario pregunta sobre las perspectivas futuras y la adopción de las Redes Neuronales Spiking y las Redes Neuronales Líquidas, cuestionando si son áreas prometedoras para el aprendizaje y proyectos. El usuario busca discutir el potencial de estas tecnologías de computación neuromórfica.

38
ARTICLE↑ trendingReddit r/MachineLearning·17/4/2026

Which computer should I buy: Mac or custom-built 5090? [D]

El usuario busca consejo para elegir entre un Mac M5 MAX con MLX y un PC personalizado con una RTX 5090 para sus proyectos de aprendizaje automático. Su trabajo implica principalmente el ajuste fino de grandes modelos pre-entrenados y el entrenamiento desde cero, a menudo con datos de imagen/vídeo y, a veces, LLMs, lo que convierte la VRAM en un factor crítico.

36
RESEARCHarXiv CS.LG·20/4/2026

M3R: Localized Rainfall Nowcasting with Meteorology-Informed MultiModal Attention

M3R es una nueva arquitectura de IA para la predicción inmediata de lluvias que integra imágenes de radar visuales y datos numéricos de estaciones meteorológicas mediante un mecanismo de atención multimodal. Utiliza series de tiempo de estaciones meteorológicas como consultas para enfocarse selectivamente en características espaciales del radar, demostrando un rendimiento mejorado en la predicción localizada.

35
RESEARCHarXiv CS.CL·22/4/2026

Model-Agnostic Meta Learning for Class Imbalance Adaptation

Este artículo presenta Hardness-Aware Meta-Resample (HAMR), un marco unificado que aborda la adaptación al desequilibrio de clases y la dificultad de los datos en tareas de PNL. HAMR utiliza optimizaciones de dos niveles y un mecanismo de remuestreo consciente del vecindario para priorizar muestras genuinamente desafiantes y clases minoritarias, logrando mejoras sustanciales en varios conjuntos de datos desequilibrados.

35
RESEARCHarXiv CS.LG·22/4/2026

Multi-Level Temporal Graph Networks with Local-Global Fusion for Industrial Fault Diagnosis

Este artículo propone una red de grafos temporal multinivel con fusión de características local-global para el diagnóstico de fallas industriales. Aborda las complejas relaciones entre sensores mediante la construcción dinámica de grafos de correlación y la combinación de codificadores basados en LSTM para características temporales con capas de convolución de grafos para dependencias espaciales.

35
DOCDEV.to AI·hace 4d

<think>

Este contenido detalla el servicio Global API, que ofrece acceso a 184 modelos de IA con precios competitivos, como DeepSeek V4 Flash a $0.25/M y GPT-4o. Destaca características como un SLA del 99.9%, 50 solicitudes gratuitas por minuto y créditos que nunca caducan, además de opciones de Canal Pro para necesidades avanzadas.

33
RESEARCHarXiv CS.LG·16/4/2026

Automated co-design of high-performance thermodynamic cycles via graph-based hierarchical reinforcement learning

Este estudio presenta un enfoque de aprendizaje por refuerzo jerárquico basado en grafos para el codiseño automatizado de ciclos termodinámicos de alto rendimiento. La metodología utiliza redes neuronales profundas para la decodificación y un marco de RL para la evolución estructural y la optimización de parámetros.

31
RESEARCHarXiv CS.LG·hace 5d

Self-Distilled Policy Gradient

Este artículo introduce el Self-Distilled Policy Gradient (SDPG), un marco novedoso que mejora el aprendizaje por refuerzo de recompensa dispersa mediante la autodestilación on-policy. SDPG integra ventajas de verificador relativas al grupo, autodestilación exacta de vocabulario completo y regularización KL, demostrando una estabilidad y rendimiento superiores a los métodos base.

31
RESEARCHarXiv CS.CL·hace 4d

Predict and Reconstruct: Joint Objectives for Self-Supervised Language Representation Learning

Este artículo presenta un objetivo de pre-entrenamiento híbrido para codificadores de texto, que combina una pérdida de predicción de espacio latente al estilo JEPA con un objetivo estándar de modelado de lenguaje enmascarado (MLM). Este nuevo enfoque busca fomentar representaciones ancladas en estructuras semánticas más profundas en lugar de solo la identidad superficial de los tokens, mostrando incrustaciones significativamente más uniformes.

30