← heapsort-ai

deep learning

263 items

ARTICLE↑ trendingReddit r/MachineLearning·4/19/2026

What are the future prospects of Spiking Neural Networks (and particularly, neuromorphics computing) and Liquid Neural Networks? [D]

Ein Bachelorstudent erkundigt sich nach den Zukunftsaussichten und der Mainstream-Akzeptanz von Spiking Neural Networks und Liquid Neural Networks, und ob diese vielversprechende Bereiche für das Lernen und Projekte sind. Er möchte das Potenzial dieser neuromorphen Computertechnologien diskutieren.

38
ARTICLE↑ trendingReddit r/MachineLearning·4/13/2026

Implementation details of Backpropagation in Siamese networks. [D]

Der Benutzer fragt nach der korrekten Implementierung der Backpropagation in Siamesischen Netzwerken, insbesondere im Vergleich zwischen einem sequenziellen Eingabeansatz und einer Bi-Encoder-ähnlichen Methode mit gleichzeitiger Eingabe und Gewichtsaggregation. Er sucht Klärung, welche der beiden Implementierungen akkurat ist.

38
RESEARCHarXiv CS.LG·4/20/2026

M3R: Localized Rainfall Nowcasting with Meteorology-Informed MultiModal Attention

M3R ist eine neuartige KI-Architektur zur Niederschlagsvorhersage, die visuelle Radargerätebilder und numerische Wetterstationsdaten durch einen multimodalen Aufmerksamkeitsmechanismus integriert. Sie nutzt Zeitreihen von Wetterstationen als Abfragen, um sich selektiv auf räumliche Radarmerkmale zu konzentrieren und zeigt eine verbesserte Leistung bei der lokalisierten Vorhersage.

35
RESEARCHarXiv CS.CL·4/22/2026

Model-Agnostic Meta Learning for Class Imbalance Adaptation

Dieses Papier stellt Hardness-Aware Meta-Resample (HAMR) vor, ein vereinheitlichtes Framework zur adaptiven Bewältigung von Klassenungleichgewicht und Datenschwierigkeiten bei NLP-Aufgaben. HAMR nutzt Bi-Level-Optimierungen und einen Nachbarschafts-bewussten Resampling-Mechanismus, um wirklich herausfordernde Stichproben und Minderheitsklassen zu priorisieren, und erzielt erhebliche Verbesserungen bei verschiedenen unausgewogenen Datensätzen.

35
RESEARCHarXiv CS.LG·4/22/2026

Multi-Level Temporal Graph Networks with Local-Global Fusion for Industrial Fault Diagnosis

Dieses Papier schlägt ein mehrstufiges temporales Graphennetzwerk mit lokal-globaler Merkmalsfusion für die industrielle Fehlerdiagnose vor. Es behandelt komplexe, mehrstufige Beziehungen zwischen Sensoren, indem es Korrelationsgraphen dynamisch konstruiert und LSTM-basierte Encoder für temporale Merkmale mit Graph-Faltungsschichten für räumliche Abhängigkeiten kombiniert.

35
DOCDEV.to AI·vor 4T

<think>

Dieser Inhalt beschreibt den Global API-Dienst, der Zugang zu 184 KI-Modellen mit wettbewerbsfähigen Preisen bietet, wie DeepSeek V4 Flash für 0.25 $/M und GPT-4o. Er hebt Funktionen wie eine 99.9% SLA, 50 kostenlose Anfragen pro Minute und nie ablaufende Credits hervor, sowie Pro Channel-Optionen für fortgeschrittene Anforderungen.

33
RESEARCHarXiv CS.LG·4/16/2026

Automated co-design of high-performance thermodynamic cycles via graph-based hierarchical reinforcement learning

Diese Studie stellt einen graphenbasierten hierarchischen Reinforcement-Learning-Ansatz für das automatisierte Co-Design leistungsstarker thermodynamischer Zyklen vor. Dabei werden Zyklen als Graphen kodiert, ein Deep-Learning-Surrogat zur Dekodierung verwendet und ein hierarchisches RL-Framework für die strukturelle Evolution sowie Parameteroptimierung eingesetzt.

31
RESEARCHarXiv CS.LG·4/16/2026

Sparse Goodness: How Selective Measurement Transforms Forward-Forward Learning

Diese Forschung untersucht und verbessert systematisch den Forward-Forward (FF) Algorithmus durch Neugestaltung seiner lokalen Gütefunktion, die positive von negativen Daten unterscheidet. Sie führt „top-k Güte“ und „entmax-gewichtete Energie“ ein und demonstriert erhebliche Genauigkeitsverbesserungen auf Benchmarks wie Fashion-MNIST.

31
RESEARCHarXiv CS.LG·vor 5T

Self-Distilled Policy Gradient

Dieses Papier stellt den Self-Distilled Policy Gradient (SDPG) vor, ein neuartiges Framework, das spärlich belohntes Reinforcement Learning durch On-Policy-Selbst-Destillation verbessert. SDPG kombiniert gruppenrelative Verifizierervorteile, exakte vollständige Vokabular-On-Policy-Selbst-Destillation und Referenz-Policy-KL-Regularisierung und zeigt eine verbesserte Stabilität und Leistung gegenüber bestehenden Baselines.

31
RESEARCHarXiv CS.CL·vor 4T

Predict and Reconstruct: Joint Objectives for Self-Supervised Language Representation Learning

Dieser Artikel stellt ein hybrides Vor-Trainingsziel für Text-Encoder vor, das einen JEPA-ähnlichen Verlust für die Vorhersage im latenten Raum mit einem Standard-Masked Language Modelling (MLM)-Ziel kombiniert. Dieser neue Ansatz zielt darauf ab, Repräsentationen zu fördern, die an tiefere semantische Strukturen gebunden sind, anstatt nur an die oberflächliche Token-Identität, und zeigt deutlich uniformere Embeddings.

30