← heapsort-ai

deep learning

263 items

RESEARCHarXiv CS.LG·4/30/2026

RaMP: Runtime-Aware Megakernel Polymorphism for Mixture-of-Experts

RaMP ist ein routing-sensitives Dispatch-Framework zur Optimierung der Mixture-of-Experts (MoE)-Inferenz, das Leistungsverluste von 10-70% in aktuellen Systemen angeht. Es nutzt eine Leistungsbereichsanalyse und ein Wellenkostenmodell, um optimale Kernel-Konfigurationen auszuwählen, und erzielt bis zu 1.22x Kernel-Beschleunigung mit nur 0.93% mittlerem Bedauern im Vergleich zur vollständigen Suche.

27
RESEARCHarXiv CS.AI·5/6/2026

Virtual Speech Therapist: A Clinician-in-the-Loop AI Speech Therapy Agent for Personalized and Supervised Therapy

Dieses Papier entwickelt den Virtual Speech Therapist (VST), eine intelligente agentenbasierte Plattform zur Optimierung der Stotterbewertung und Bereitstellung personalisierter Therapie durch KI-gesteuerte Arbeitsabläufe. VST integriert Deep Learning zur Klassifizierung von Stottern und Multi-Agenten-LLM-Argumentation zur Erstellung und Verfeinerung individueller Therapiepläne, wobei ein Kritiker-Agent die klinische Sicherheit und die Einhaltung von Richtlinien gewährleistet.

27
RESEARCHarXiv CS.AI·4/8/2026

MedGemma 1.5 Technical Report

O MedGemma 1.5 4B é um novo modelo que expande as capacidades do MedGemma 1, integrando análise de imagens médicas de alta dimensão (CT/MRI, histopatologia), localização anatômica e compreensão de documentos médicos. Ele demonstra ganhos significativos em precisão de classificação de condições em MRI e CT, e um aumento de 47% no macro F1 para imagens de patologia de lâmina inteira.

27
RESEARCHarXiv CS.LG·4/6/2026

Convolutional Surrogate for 3D Discrete Fracture-Matrix Tensor Upscaling

Este estudo aborda o alto custo computacional da modelagem de fluxo de água subterrânea em meios fraturados usando simulações DFM. Para otimizar o processo, propõe-se um modelo substituto baseado em rede neural convolucional 3D para prever a condutividade hidráulica equivalente, permitindo um framework Monte Carlo multinível mais eficiente.

27
RESEARCHarXiv CS.CL·4/6/2026

CIPHER: Conformer-based Inference of Phonemes from High-density EEG

CIPHER é um modelo baseado em Conformer para inferência de fonemas a partir de EEG de alta densidade, visando decodificar informações de fala do cérebro. Embora alcance alta performance em tarefas binárias, mostra desempenho limitado na discriminação de fonemas de 11 classes, sendo posicionado como um estudo de benchmark e comparação de características.

27
RESEARCHarXiv CS.CL·vor 28T

jina-embeddings-v5-omni: Geometry-preserving Embeddings via Locked Aligned Towers

Diese Arbeit stellt GELATO vor, einen neuartigen Ansatz für multimodale Embedding-Modelle, der VLM-Architekturen erweitert. Dies führt zur jina-embeddings-v5-omni-Suite, die Text, Bilder, Audio und Video effizient in einen einzigen semantischen Embedding-Raum kodiert, indem Basis-Textmodelle eingefroren und nur Verbindungskomponenten trainiert werden.

27
ARTICLEDEV.to AI·4/22/2026

Blog 2: Momentum-Based Optimizers

Der Bloginhalt behandelt momentum-basierte Optimierer und untersucht deren Funktion und Bedeutung für die Beschleunigung des Trainings von Machine-Learning-Modellen. Er beschreibt detailliert, wie diese Algorithmen die Konvergenz und Effizienz neuronaler Netze verbessern.

27
RESEARCHDEV.to AI·4/21/2026

Learning to be Safe: Deep RL with a Safety Critic

Dieser Inhalt untersucht einen neuartigen Ansatz für Deep Reinforcement Learning durch die Integration eines "Sicherheitskritikers" zur Vermeidung unsicherer Aktionen. Die Methodik zielt darauf ab, die Zuverlässigkeit und Robustheit von KI-Agenten zu verbessern, wodurch sie für den Einsatz in der realen Welt geeignet werden, wo Sicherheit von entscheidender Bedeutung ist.

27
RESEARCHarXiv CS.LG·4/17/2026

The Devil Is in Gradient Entanglement: Energy-Aware Gradient Coordinator for Robust Generalized Category Discovery

Dieses Forschungspapier stellt einen energiebewussten Gradientenkoordinator vor, um die "Gradientenverschränkung" anzugehen, eine zentrale Herausforderung bei der robusten verallgemeinerten Kategorieentdeckung. Die vorgeschlagene Methode zielt darauf ab, die Robustheit und Leistung von KI-Modellen bei der Identifizierung neuer Kategorien zu verbessern.

27