deep learning

263 items

RESEARCHDEV.to AI·4/23/2026

Survey of Dropout Methods for Deep Neural Networks

Dieser Inhalt bietet eine umfassende Übersicht über verschiedene Dropout-Methoden, die in tiefen neuronalen Netzen eingesetzt werden. Er untersucht, wie diese Regularisierungstechniken Überanpassung verhindern und die Generalisierungsfähigkeit von KI-Modellen verbessern.

neural networks deep learning machine learning regularization

ARTICLE↑ trendingReddit r/MachineLearning·4/19/2026

What are the future prospects of Spiking Neural Networks (and particularly, neuromorphics computing) and Liquid Neural Networks? [D]

Ein Bachelorstudent erkundigt sich nach den Zukunftsaussichten und der Mainstream-Akzeptanz von Spiking Neural Networks und Liquid Neural Networks, und ob diese vielversprechende Bereiche für das Lernen und Projekte sind. Er möchte das Potenzial dieser neuromorphen Computertechnologien diskutieren.

Spiking Neural Networks deep learning Liquid Neural Networks Neuromorphic Computing

ARTICLE↑ trendingReddit r/MachineLearning·4/13/2026

Implementation details of Backpropagation in Siamese networks. [D]

Der Benutzer fragt nach der korrekten Implementierung der Backpropagation in Siamesischen Netzwerken, insbesondere im Vergleich zwischen einem sequenziellen Eingabeansatz und einer Bi-Encoder-ähnlichen Methode mit gleichzeitiger Eingabe und Gewichtsaggregation. Er sucht Klärung, welche der beiden Implementierungen akkurat ist.

implementation details neural networks deep learning siamese networks

ARTICLE↑ trendingReddit r/MachineLearning·4/17/2026

Which computer should I buy: Mac or custom-built 5090? [D]

Der Nutzer sucht Rat bei der Wahl zwischen einem Mac M5 MAX mit MLX und einem Custom-PC mit RTX 5090 für seine Machine-Learning-Projekte. Seine Arbeit umfasst vorwiegend das Fine-Tuning großer vortrainierter Modelle und Training von Grund auf, oft mit Bild-/Videodaten und manchmal LLMs, wodurch VRAM ein entscheidender Faktor ist.

deep learning GPU machine learning hardware

NEWS↑ trendingReddit r/MachineLearning·4/12/2026

"There's a new generation of empirical deep learning researchers, hacking away at whatever seems trendy, blowing with the wind" [D]

Der Inhalt kritisiert die neue Generation von Deep-Learning-Forschern dafür, Trends zu folgen. Der Autor sucht eine Diskussion über den komplexen Begriff „post-agentische KI“, mit dem er Schwierigkeiten hat.

AI trends deep learning post-agentic AI AI concepts

RESEARCHarXiv CS.LG·4/20/2026

M3R: Localized Rainfall Nowcasting with Meteorology-Informed MultiModal Attention

M3R ist eine neuartige KI-Architektur zur Niederschlagsvorhersage, die visuelle Radargerätebilder und numerische Wetterstationsdaten durch einen multimodalen Aufmerksamkeitsmechanismus integriert. Sie nutzt Zeitreihen von Wetterstationen als Abfragen, um sich selektiv auf räumliche Radarmerkmale zu konzentrieren und zeigt eine verbesserte Leistung bei der lokalisierten Vorhersage.

nowcasting multimodal AI deep learning AI

RESEARCHarXiv CS.LG·4/20/2026

Dispatch-Aware Ragged Attention for Pruned Vision Transformers

Diese Arbeit untersucht den Dispatch-Overhead als Engpass, der verhindert, dass Token-Pruning die Latenz in Vision Transformers (ViTs) vollständig reduziert. Es wird ein leichter Triton-Aufmerksamkeitskernel vorgestellt, der diesen Overhead erheblich senkt und den End-to-End-Durchsatz für beschnittene ViTs um bis zu 2,24x steigert.

AI models deep learning Performance optimization attention mechanisms

RESEARCHarXiv CS.CL·4/22/2026

Model-Agnostic Meta Learning for Class Imbalance Adaptation

Dieses Papier stellt Hardness-Aware Meta-Resample (HAMR) vor, ein vereinheitlichtes Framework zur adaptiven Bewältigung von Klassenungleichgewicht und Datenschwierigkeiten bei NLP-Aufgaben. HAMR nutzt Bi-Level-Optimierungen und einen Nachbarschafts-bewussten Resampling-Mechanismus, um wirklich herausfordernde Stichproben und Minderheitsklassen zu priorisieren, und erzielt erhebliche Verbesserungen bei verschiedenen unausgewogenen Datensätzen.

Meta-Learning deep learning machine learning Natural Language Processing

RESEARCHarXiv CS.LG·4/22/2026

Multi-Level Temporal Graph Networks with Local-Global Fusion for Industrial Fault Diagnosis

Dieses Papier schlägt ein mehrstufiges temporales Graphennetzwerk mit lokal-globaler Merkmalsfusion für die industrielle Fehlerdiagnose vor. Es behandelt komplexe, mehrstufige Beziehungen zwischen Sensoren, indem es Korrelationsgraphen dynamisch konstruiert und LSTM-basierte Encoder für temporale Merkmale mit Graph-Faltungsschichten für räumliche Abhängigkeiten kombiniert.

fault diagnosis industrial AI deep learning Graph Neural Networks

RESEARCHDEV.to AI·vor 2T

Development and Validation of Deep Learning Algorithms for Detection of CriticalFindings in Head CT Scans

Dieser Inhalt befasst sich mit der Entwicklung und Validierung von Deep-Learning-Algorithmen zur Erkennung kritischer Befunde bei Kopf-CT-Scans. Die Forschung untersucht die Anwendung künstlicher Intelligenz zur Verbesserung der Erkennung in der medizinischen Diagnostik.

deep learning diagnostic imaging CT scans healthcare AI

DOCDEV.to AI·vor 4T

<think>

Dieser Inhalt beschreibt den Global API-Dienst, der Zugang zu 184 KI-Modellen mit wettbewerbsfähigen Preisen bietet, wie DeepSeek V4 Flash für 0.25 $/M und GPT-4o. Er hebt Funktionen wie eine 99.9% SLA, 50 kostenlose Anfragen pro Minute und nie ablaufende Credits hervor, sowie Pro Channel-Optionen für fortgeschrittene Anforderungen.

AI models deep learning cloud services API

ARTICLEDEV.to AI·vor 3T

Face Recognition: From Traditional to Deep Learning Methods

Dieser Inhalt untersucht Gesichtserkennungsmethoden, von traditionellen Ansätzen bis hin zu den neuesten Deep-Learning-Techniken. Er bietet einen umfassenden Überblick über die Entwicklung und die in diesem Bereich der künstlichen Intelligenz eingesetzten Technologien.

deep learning Face Recognition computer vision AI Methods

RESEARCHarXiv CS.LG·4/16/2026

Automated co-design of high-performance thermodynamic cycles via graph-based hierarchical reinforcement learning

Diese Studie stellt einen graphenbasierten hierarchischen Reinforcement-Learning-Ansatz für das automatisierte Co-Design leistungsstarker thermodynamischer Zyklen vor. Dabei werden Zyklen als Graphen kodiert, ein Deep-Learning-Surrogat zur Dekodierung verwendet und ein hierarchisches RL-Framework für die strukturelle Evolution sowie Parameteroptimierung eingesetzt.

Energy Systems deep learning reinforcement learning Graph Neural Networks

RESEARCHarXiv CS.LG·4/16/2026

Sparse Goodness: How Selective Measurement Transforms Forward-Forward Learning

Diese Forschung untersucht und verbessert systematisch den Forward-Forward (FF) Algorithmus durch Neugestaltung seiner lokalen Gütefunktion, die positive von negativen Daten unterscheidet. Sie führt „top-k Güte“ und „entmax-gewichtete Energie“ ein und demonstriert erhebliche Genauigkeitsverbesserungen auf Benchmarks wie Fashion-MNIST.

neural networks goodness function Forward-Forward algorithm deep learning

RESEARCHarXiv CS.LG·vor 5T

Self-Distilled Policy Gradient

Dieses Papier stellt den Self-Distilled Policy Gradient (SDPG) vor, ein neuartiges Framework, das spärlich belohntes Reinforcement Learning durch On-Policy-Selbst-Destillation verbessert. SDPG kombiniert gruppenrelative Verifizierervorteile, exakte vollständige Vokabular-On-Policy-Selbst-Destillation und Referenz-Policy-KL-Regularisierung und zeigt eine verbesserte Stabilität und Leistung gegenüber bestehenden Baselines.

language models deep learning reinforcement learning Policy Gradient

ARTICLEDEV.to AI·4/22/2026

Autoencoders and Representation Learning in Vision

Autoencoder sind neuronale Netze, die Daten in einen niedrigerdimensionalen Raum komprimieren und das Original rekonstruieren, wobei sie im Gegensatz zur linearen PCA nicht-lineare Strukturen lernen. Ihr zweistufiges Design umfasst einen Encoder, der Eingabedaten in einen latenten Raum projiziert, um die informativsten Merkmale zu extrahieren.

neural networks deep learning autoencoders machine learning

ARTICLEDEV.to AI·4/11/2026

A Review of Sparse Expert Models in Deep Learning

Dieser Inhalt analysiert Sparse Expert Models im Deep Learning, eine fundamentale Architektur für die Skalierbarkeit und Effizienz großer neuronaler Netze. Die Untersuchung beleuchtet deren Anwendung und Auswirkungen im Bereich der fortgeschrittenen künstlichen Intelligenz.

neural networks deep learning Sparse Models AI Architectures

RESEARCHDEV.to AI·vor 3T

Exponentially Faster Language Modelling

Dieser Inhalt behandelt Methoden zur signifikanten Beschleunigung des Trainings und der Inferenz von Sprachmodellen. Er untersucht neuartige Architekturen oder algorithmische Optimierungen zur Effizienzsteigerung.

deep learning Natural Language Processing AI language modelling

RESEARCHarXiv CS.CL·vor 4T

Predict and Reconstruct: Joint Objectives for Self-Supervised Language Representation Learning

Dieser Artikel stellt ein hybrides Vor-Trainingsziel für Text-Encoder vor, das einen JEPA-ähnlichen Verlust für die Vorhersage im latenten Raum mit einem Standard-Masked Language Modelling (MLM)-Ziel kombiniert. Dieser neue Ansatz zielt darauf ab, Repräsentationen zu fördern, die an tiefere semantische Strukturen gebunden sind, anstatt nur an die oberflächliche Token-Identität, und zeigt deutlich uniformere Embeddings.

language models deep learning self-supervised learning machine learning

RESEARCHDEV.to AI·vor 3T

Aligning where to see and what to tell: image caption with region-basedattention and scene factorization

Diese Arbeit stellt eine Methode zur Bildunterschriftengenerierung vor, die regionenbasierte Aufmerksamkeit und Szenenfaktorisierung nutzt, um die beschreibende Relevanz und Genauigkeit zu verbessern. Ziel ist es, die visuelle Wahrnehmung effektiver mit der textlichen Erzählung abzugleichen.

scene understanding deep learning computer vision attention mechanisms