deep learning

263 items

RESEARCHDEV.to AI·4/21/2026

Multi-Objective Deep Reinforcement Learning

Dieser Inhalt befasst sich mit dem Bereich des Multi-Objective Deep Reinforcement Learning. Er behandelt wahrscheinlich Techniken zum Trainieren von KI-Agenten, um mehrere Leistungskriterien gleichzeitig zu optimieren.

Optimization deep learning reinforcement learning

ARTICLEDEV.to AI·4/26/2026

Your Transformer is Secretly Linear

Dieser Artikel untersucht die Idee, dass Transformer-Modelle trotz ihrer Komplexität lineare Eigenschaften aufweisen oder ihnen in bestimmten Aspekten gleichwertig sein könnten. Die Diskussion vertieft die grundlegende Natur dieser KI-Modelle und ihre Implikationen.

neural networks deep learning machine learning AI

DOCDEV.to AI·4/28/2026

Building a No-Install AI Upscaler: Leveraging Cloud GPUs for Seamless Image Processing

Der GoHard AI Upscaler ist ein browserbasiertes Tool zur professionellen Bildverbesserung, das keine leistungsstarke lokale Hardware erfordert. Es ermöglicht eine installationsfreie Nutzung und konstante Leistung durch den Einsatz von Python, optimierten KI-Modellen und Google Colab Cloud-GPUs.

Image processing deep learning cloud computing machine learning

DOCHugging Face Blog·vor 12T

Profiling in PyTorch (Part 1): A Beginner's Guide to torch.profiler

Dieser Artikel ist ein Leitfaden für Anfänger zur Verwendung von `torch.profiler` für die Leistungsanalyse in PyTorch. Er erklärt, wie Deep-Learning-Modelle effektiv profiliert werden, um Engpässe zu identifizieren und die Ausführung zu optimieren.

deep learning learning profiling performance

RESEARCHarXiv CS.LG·4/30/2026

RaMP: Runtime-Aware Megakernel Polymorphism for Mixture-of-Experts

RaMP ist ein routing-sensitives Dispatch-Framework zur Optimierung der Mixture-of-Experts (MoE)-Inferenz, das Leistungsverluste von 10-70% in aktuellen Systemen angeht. Es nutzt eine Leistungsbereichsanalyse und ein Wellenkostenmodell, um optimale Kernel-Konfigurationen auszuwählen, und erzielt bis zu 1.22x Kernel-Beschleunigung mit nur 0.93% mittlerem Bedauern im Vergleich zur vollständigen Suche.

deep learning AI optimization performance

RESEARCHarXiv CS.AI·5/6/2026

Virtual Speech Therapist: A Clinician-in-the-Loop AI Speech Therapy Agent for Personalized and Supervised Therapy

Dieses Papier entwickelt den Virtual Speech Therapist (VST), eine intelligente agentenbasierte Plattform zur Optimierung der Stotterbewertung und Bereitstellung personalisierter Therapie durch KI-gesteuerte Arbeitsabläufe. VST integriert Deep Learning zur Klassifizierung von Stottern und Multi-Agenten-LLM-Argumentation zur Erstellung und Verfeinerung individueller Therapiepläne, wobei ein Kritiker-Agent die klinische Sicherheit und die Einhaltung von Richtlinien gewährleistet.

deep learning AI in healthcare speech therapy stuttering

RESEARCHarXiv CS.AI·4/8/2026

MedGemma 1.5 Technical Report

O MedGemma 1.5 4B é um novo modelo que expande as capacidades do MedGemma 1, integrando análise de imagens médicas de alta dimensão (CT/MRI, histopatologia), localização anatômica e compreensão de documentos médicos. Ele demonstra ganhos significativos em precisão de classificação de condições em MRI e CT, e um aumento de 47% no macro F1 para imagens de patologia de lâmina inteira.

deep learning AI healthcare AI Medical Imaging

RESEARCHarXiv CS.LG·4/6/2026

Convolutional Surrogate for 3D Discrete Fracture-Matrix Tensor Upscaling

Este estudo aborda o alto custo computacional da modelagem de fluxo de água subterrânea em meios fraturados usando simulações DFM. Para otimizar o processo, propõe-se um modelo substituto baseado em rede neural convolucional 3D para prever a condutividade hidráulica equivalente, permitindo um framework Monte Carlo multinível mais eficiente.

Simulação Numérica Modelos Substitutos Modelagem Hidrogeológica Monte Carlo

RESEARCHarXiv CS.CL·4/6/2026

CIPHER: Conformer-based Inference of Phonemes from High-density EEG

CIPHER é um modelo baseado em Conformer para inferência de fonemas a partir de EEG de alta densidade, visando decodificar informações de fala do cérebro. Embora alcance alta performance em tarefas binárias, mostra desempenho limitado na discriminação de fonemas de 11 classes, sendo posicionado como um estudo de benchmark e comparação de características.

deep learning speech decoding brain-computer interface machine learning

RESEARCHarXiv CS.CL·vor 28T

jina-embeddings-v5-omni: Geometry-preserving Embeddings via Locked Aligned Towers

Diese Arbeit stellt GELATO vor, einen neuartigen Ansatz für multimodale Embedding-Modelle, der VLM-Architekturen erweitert. Dies führt zur jina-embeddings-v5-omni-Suite, die Text, Bilder, Audio und Video effizient in einen einzigen semantischen Embedding-Raum kodiert, indem Basis-Textmodelle eingefroren und nur Verbindungskomponenten trainiert werden.

embedding models multimodal AI deep learning machine learning

ARTICLEML Mastery·vor 10T

Serving Multiple Users at Once: How Continuous Batching Keeps LLM Inference Efficient

Dieser Artikel untersucht, wie Continuous Batching die Effizienz der LLM-Inferenz verbessert und die Probleme des statischen Batching angeht. Er beschreibt dynamische Planung und Ragged Batching zur gleichzeitigen Verarbeitung mehrerer Anfragen.

inference deep learning efficiency Batching

Serving Multiple Users at Once: How Continuous Batching Keeps LLM Inference Efficient

ARTICLELangChain Blog·vor 20T

Interpreters in Deep Agents: Code Between Tool Calls and Sandboxes

Deep Agents unterstützt jetzt Interpreter: kleine eingebettete Laufzeitumgebungen, in denen Agenten Code schreiben, um Tools zu koordinieren, den Arbeitszustand zu halten und zu entscheiden, was in den Modellkontext gelangt.

deep learning Tool Coordination Runtime Environments Interpreters

Interpreters in Deep Agents: Code Between Tool Calls and Sandboxes

ARTICLEDEV.to AI·4/22/2026

Blog 2: Momentum-Based Optimizers

Der Bloginhalt behandelt momentum-basierte Optimierer und untersucht deren Funktion und Bedeutung für die Beschleunigung des Trainings von Machine-Learning-Modellen. Er beschreibt detailliert, wie diese Algorithmen die Konvergenz und Effizienz neuronaler Netze verbessern.

deep learning machine learning AI Algorithms

RESEARCHDEV.to AI·4/21/2026

Learning to be Safe: Deep RL with a Safety Critic

Dieser Inhalt untersucht einen neuartigen Ansatz für Deep Reinforcement Learning durch die Integration eines "Sicherheitskritikers" zur Vermeidung unsicherer Aktionen. Die Methodik zielt darauf ab, die Zuverlässigkeit und Robustheit von KI-Agenten zu verbessern, wodurch sie für den Einsatz in der realen Welt geeignet werden, wo Sicherheit von entscheidender Bedeutung ist.

deep learning reinforcement learning security machine learning

DOCGoogle for Developers (YouTube)·4/30/2026

Unlocking Low-Level Control: Customizing Keras Training Loops with JAX

Dieser Inhalt behandelt, wie man Low-Level-Kontrolle erlangt und Keras-Trainingsschleifen anpasst. Er beschreibt die Integration mit JAX, um größere Flexibilität und Leistung bei der Entwicklung von Machine-Learning-Modellen zu ermöglichen.

Training Loops Keras deep learning machine learning

Unlocking Low-Level Control: Customizing Keras Training Loops with JAX

RESEARCHarXiv CS.LG·4/17/2026

The Devil Is in Gradient Entanglement: Energy-Aware Gradient Coordinator for Robust Generalized Category Discovery

Dieses Forschungspapier stellt einen energiebewussten Gradientenkoordinator vor, um die "Gradientenverschränkung" anzugehen, eine zentrale Herausforderung bei der robusten verallgemeinerten Kategorieentdeckung. Die vorgeschlagene Methode zielt darauf ab, die Robustheit und Leistung von KI-Modellen bei der Identifizierung neuer Kategorien zu verbessern.

Gradient Descent category discovery deep learning machine learning

RESEARCHarXiv CS.AI·4/15/2026

Identity as Attractor: Geometric Evidence for Persistent Agent Architecture in LLM Activation Space

Diese Studie untersucht Identität als Attraktor in der persistenten Agentenarchitektur in den Aktivierungsräumen von LLMs. Sie präsentiert geometrische Beweise, um die zugrunde liegende Struktur und das Verhalten von Sprachmodellen zu verstehen.

AI architecture LLMs deep learning computational geometry

RESEARCHarXiv CS.LG·4/13/2026

Ranked Activation Shift for Post-Hoc Out-of-Distribution Detection

Diese Forschung stellt eine Methode namens Ranked Activation Shift zur Post-hoc-Erkennung von Out-of-Distribution-Daten vor. Ziel ist es, die Identifizierung von Datenstichproben zu verbessern, die von der Trainingsverteilung abweichen.

OOD Detection neural networks deep learning machine learning

ARTICLETwo Minute Papers (YouTube)·4/28/2026

Solved: The Bug That Haunted AI Video For Years

Ein hartnäckiger Fehler, der die KI-Videotechnologie seit Jahren beeinträchtigt hat, wurde endlich behoben. Diese Lösung stellt einen bedeutenden Fortschritt für die Qualität und Stabilität von auf künstlicher Intelligenz basierenden Videosystemen dar.

AI video deep learning computer vision bug fix

Solved: The Bug That Haunted AI Video For Years

RESEARCHHugging Face Blog·3/9/2026

Ulysses Sequence Parallelism: Training with Million-Token Contexts

Este conteúdo aborda o paralelismo de sequência Ulysses, uma técnica inovadora para o treinamento de modelos de inteligência artificial. O foco está na capacitação de modelos para processar contextos de milhões de tokens de forma eficiente.

deep learning Long Contexts Training High-Performance Computing