← heapsort-ai

research

78 items

RESEARCH↑ trendingReddit r/MachineLearning·4/20/2026

Open-source single-GPU reproductions of Cartridges and STILL for neural KV-cache compaction [P]

Der Autor hat zwei aktuelle Ideen, Cartridges und STILL, zur neuronalen KV-Cache-Kompaktion und Langkontext-Inferenz implementiert und als Open Source veröffentlicht. Ziel ist es, diese Forschungsideen mit Benchmark-Code einfach überprüfbar und ausführbar zu machen und sie auch mit bestehenden Methoden zu vergleichen.

42
ARTICLE↑ trendingReddit r/MachineLearning·5/3/2026

Are modern ML PhDs becoming too incremental, or is this just what research looks like now? [D]

Der Text erörtert, ob moderne ML-Doktorarbeiten zu inkrementell werden, oft indem sie bestehende Ideen kombinieren und in leicht abgewandelten Umgebungen mit Benchmark-Ergebnissen anwenden. Der Autor hinterfragt, ob dies einen tieferen wissenschaftlichen Beitrag darstellt, und hat das Gefühl, dass viele Dissertationen erweiterten Masterarbeiten ähneln.

42
NEWS↑ trendingReddit r/MachineLearning·vor 20T

OpenAI claims a general-purpose reasoning model found a counterexample to Erdos's unit-distance bound [D]

OpenAI gab heute bekannt, dass eines seiner Allzweck-Argumentationsmodelle eine Konstruktion gefunden hat, die eine vermutete Obergrenze im Erdős'schen Problem der planaren Einheitsdistanz widerlegt. Dies stellt eine bedeutende Entwicklung in der Fähigkeit der KI zum fortgeschrittenen mathematischen Denken und zur Problemlösung dar.

42
ARTICLE↑ trendingReddit r/MachineLearning·4/27/2026

Maths vs machine learning publishing venues [D]

Ein forschender Mathematiker hat ein langes Papier in theoretischer Informatik verfasst, das für maschinelles Lernen relevant ist, und sucht Rat zu geeigneten ML-Fachzeitschriften für die Veröffentlichung. Er sucht Äquivalente zu etablierten mathematischen Fachzeitschriften wie den „Transactions of the AMS“.

39
ARTICLE↑ trendingReddit r/MachineLearning·4/19/2026

Tier-3 ISE final year with ongoing ML research (TMLR/Q1/NeurIPS target), trying to understand real impact in India [D]

Ein ISE-Student im Abschlussjahr mit Schwerpunkt auf ML-Forschung und Publikationen (TMLR/NeurIPS-Ziel) möchte den tatsächlichen Einfluss seiner Arbeit auf die Sicherung von ML-/SDE-Rollen in Indien verstehen. Er hinterfragt, wie sich seine Forschungsleistungen im Vergleich zum traditionellen Entwicklungsweg auf dem indischen Arbeitsmarkt auswirken.

37
ARTICLE↑ trendingReddit r/MachineLearning·5/1/2026

AI/ML Conferences [D]

Ein ML-Forscher äußert Entmutigung über das aktuelle Begutachtungssystem für Top-KI/ML-Konferenzen und nennt Fälle, in denen Arbeiten trotz Berücksichtigung aller Gutachterbedenken abgelehnt werden. Der Beitrag sucht nach besseren Wegen, um einen fairen Begutachtungsprozess für die hohe Anzahl von Einreichungen zu gewährleisten.

36
RESEARCH↑ trendingReddit r/MachineLearning·vor 19T

Novel Problems in VLA [R]

Ein Forschungsstudent sucht Ratschläge zur Entwicklung neuartiger Forschungsideen im Bereich VLA, da er das Feld als gesättigt empfindet. Er hatte eine Idee umgesetzt, nur um festzustellen, dass diese bereits veröffentlicht wurde, und sucht nun nach neuen Ansätzen für sein Projekt.

36
RESEARCH↑ trendingReddit r/MachineLearning·5/5/2026

Struggling to reproduce paper results before improving them — stuck below reported accuracy [R]

Ein Doktorand in KI/Computer Vision hat Schwierigkeiten, die in einem veröffentlichten Papier berichtete Genauigkeit zu reproduzieren, und erreicht konsequent etwa 73% gegenüber der Baselinie des Papiers von ~77%. Trotz sorgfältiger Überprüfungen und Kontaktversuchen mit den Autoren stößt der Student auf eine Reproduktionslücke, die weitere Forschungsarbeiten behindert.

36
RESEARCHarXiv CS.CL·vor 1T

How Language Models Fail: Token-Level Signatures of Committed and Persistent Reasoning Failures

Fehler im Sprachmodell-Denken entstehen durch unterschiedliche Prozesse, die identifizierbare Token-Level-Signaturen hinterlassen. Diese Fehler werden als „festgelegter Fehler“ oder „anhaltende Unsicherheit“ charakterisiert, und das Verständnis dieser Signaturen hilft, fehlerhafte von erfolgreichen Vervollständigungen in verschiedenen Konfigurationen zu unterscheiden.

36
DOC↑ trendingReddit r/MachineLearning·vor 28T

How do you create memorable poster for top tier conferences ( ICML/ICLR/NEURips ect…) [D]

Ein Benutzer, der zum ersten Mal auf einer hochrangigen Konferenz (ICML/ICLR/NeurIPS) präsentiert, hat Schwierigkeiten mit dem Posterdesign, findet seine Versuche basic und stößt auf Probleme mit der Größe und den Druckkosten. Er sucht Designtipps, Softwareempfehlungen (PowerPoint vs. Canvas) und allgemeine Ratschläge, um ein einprägsames Poster für einen theorieorientierten Artikel zu erstellen.

33