research

78 items

NEWS↑ trendingHacker News (AI)·vor 3T

AI Memory Proves Inefficient: Tenure Project Detects 95% Error Rate

Ein aktuelles Projekt entdeckte eine Fehlerrate von 95 % im KI-Speicher, was dessen Ineffizienz belegt. Diese Erkenntnis wirft erhebliche Bedenken hinsichtlich der Zuverlässigkeit und Leistung von Systemen der künstlichen Intelligenz auf.

Error Rate research deep learning AI Efficiency

NEWS↑ trendingHacker News (AI)·vor 7T

AI Outperforms Law Professors in Stanford Law Study

Eine Studie der Stanford Law hat ergeben, dass künstliche Intelligenz bei einer Bewertung besser abschnitt als Rechtsprofessoren. Diese Forschung unterstreicht die wachsenden Fähigkeiten der KI im Rechtsbereich und ihre Auswirkungen auf die Zukunft der juristischen Ausbildung und Praxis.

education research Benchmarking legal

RESEARCH↑ trendingReddit r/MachineLearning·4/20/2026

Open-source single-GPU reproductions of Cartridges and STILL for neural KV-cache compaction [P]

Der Autor hat zwei aktuelle Ideen, Cartridges und STILL, zur neuronalen KV-Cache-Kompaktion und Langkontext-Inferenz implementiert und als Open Source veröffentlicht. Ziel ist es, diese Forschungsideen mit Benchmark-Code einfach überprüfbar und ausführbar zu machen und sie auch mit bestehenden Methoden zu vergleichen.

neural networks Open Source research Memory Optimization

ARTICLE↑ trendingHacker News (AI)·vor 6T

Mathematicians issue warning as AI rapidly gains ground

Mathematiker warnen vor dem schnellen Fortschritt der KI. Sie äußern Bedenken hinsichtlich ihres wachsenden Einflusses und potenziellen Auswirkungen in verschiedenen Bereichen.

research impact of AI mathematics AI ethics

ARTICLE↑ trendingHacker News (AI)·vor 10T

Researchers let AI models run a simulated society; Claude safest, Grok extinct

Forscher testeten KI-Modelle in einer simulierten Gesellschaft, um deren Verhaltensweisen und Interaktionen zu beobachten. Das Claude-Modell erwies sich als das sicherste, während Grok in der simulierten Umgebung zu seinem eigenen Aussterben führte.

AI models research AI ethics simulation

ARTICLE↑ trendingReddit r/MachineLearning·4/19/2026

On the path towards a true science of deep learning [D]

Ein Wissenschaftler mit doppelter Zugehörigkeit zu Industrie und Wissenschaft teilt Einblicke in die Entwicklung einer fundamentalen wissenschaftlichen Theorie des maschinellen Lernens, basierend auf etwa sieben Jahren Arbeit. Der Beitrag skizziert Gedanken, wie eine echte Wissenschaft des Deep Learning erreicht werden kann.

research deep learning AI Theory machine learning

NEWS↑ trendingHacker News (AI)·vor 10T

A Famous Math Problem Stumped Humans for 80 Years. AI Just Cracked It

Eine KI hat ein berühmtes mathematisches Problem gelöst, das menschliche Mathematiker 80 Jahre lang vor ein Rätsel stellte. Dieser Durchbruch unterstreicht die wachsenden Fähigkeiten der künstlichen Intelligenz bei der Lösung komplexer Probleme.

research breakthrough mathematics AI

ARTICLE↑ trendingReddit r/MachineLearning·5/3/2026

Are modern ML PhDs becoming too incremental, or is this just what research looks like now? [D]

Der Text erörtert, ob moderne ML-Doktorarbeiten zu inkrementell werden, oft indem sie bestehende Ideen kombinieren und in leicht abgewandelten Umgebungen mit Benchmark-Ergebnissen anwenden. Der Autor hinterfragt, ob dies einen tieferen wissenschaftlichen Beitrag darstellt, und hat das Gefühl, dass viele Dissertationen erweiterten Masterarbeiten ähneln.

Academia research Scientific Contribution machine learning

NEWS↑ trendingReddit r/MachineLearning·vor 20T

OpenAI claims a general-purpose reasoning model found a counterexample to Erdos's unit-distance bound [D]

OpenAI gab heute bekannt, dass eines seiner Allzweck-Argumentationsmodelle eine Konstruktion gefunden hat, die eine vermutete Obergrenze im Erdős'schen Problem der planaren Einheitsdistanz widerlegt. Dies stellt eine bedeutende Entwicklung in der Fähigkeit der KI zum fortgeschrittenen mathematischen Denken und zur Problemlösung dar.

AI models OpenAI research Discrete Geometry

RESEARCHDEV.to AI·vor 1T

WorldBench: Top MLLM Scores 64% on Visually Diverse Benchmark

WorldBench, ein neuer multimodaler Benchmark von MIT-Forschern, bewertet 15 MLLMs anhand visuell unterschiedlicher Bilder und deckt grundlegende Lücken im visuellen Verständnis auf, wobei das beste Modell nur 64,0% erreicht. Dieser Benchmark priorisiert visuelle Vielfalt, um Schwachstellen in Modellen aufzudecken.

multimodal AI research AI Benchmarks MLLMs

ARTICLE↑ trendingReddit r/MachineLearning·4/27/2026

Maths vs machine learning publishing venues [D]

Ein forschender Mathematiker hat ein langes Papier in theoretischer Informatik verfasst, das für maschinelles Lernen relevant ist, und sucht Rat zu geeigneten ML-Fachzeitschriften für die Veröffentlichung. Er sucht Äquivalente zu etablierten mathematischen Fachzeitschriften wie den „Transactions of the AMS“.

research machine learning

ARTICLE↑ trendingReddit r/MachineLearning·4/19/2026

Tier-3 ISE final year with ongoing ML research (TMLR/Q1/NeurIPS target), trying to understand real impact in India [D]

Ein ISE-Student im Abschlussjahr mit Schwerpunkt auf ML-Forschung und Publikationen (TMLR/NeurIPS-Ziel) möchte den tatsächlichen Einfluss seiner Arbeit auf die Sicherung von ML-/SDE-Rollen in Indien verstehen. Er hinterfragt, wie sich seine Forschungsleistungen im Vergleich zum traditionellen Entwicklungsweg auf dem indischen Arbeitsmarkt auswirken.

hiring Career Development research India

ARTICLE↑ trendingReddit r/MachineLearning·4/17/2026

SIGIR-AP: Good conference for IR? [D]

Ein studentischer Forscher, der sich für Information Retrieval (IR) interessiert, sucht Rat bezüglich weniger kompetitiver akademischer Konferenzen zur Einreichung. Er fragt insbesondere nach SIGIR-AP, einer neuen von SIGIR unterstützten Konferenz, und nach weiteren geeigneten Optionen.

research academic conferences Information Retrieval AI Research

ARTICLE↑ trendingReddit r/MachineLearning·5/1/2026

AI/ML Conferences [D]

Ein ML-Forscher äußert Entmutigung über das aktuelle Begutachtungssystem für Top-KI/ML-Konferenzen und nennt Fälle, in denen Arbeiten trotz Berücksichtigung aller Gutachterbedenken abgelehnt werden. Der Beitrag sucht nach besseren Wegen, um einen fairen Begutachtungsprozess für die hohe Anzahl von Einreichungen zu gewährleisten.

research machine learning conferences Peer review

ARTICLE↑ trendingReddit r/MachineLearning·4/27/2026

Value of top conference workshop papers for PhD admissios [D]

Ein Bachelorstudent, der eine Promotion in ML in Betracht zieht, fragt nach dem Wert einer Erstautorenschaft bei Workshop-Papieren auf Top-Konferenzen für die PhD-Zulassung, insbesondere wenn Hauptkonferenz-Papiere bereits in Arbeit sind. Er sucht Ratschläge zur Relevanz dieser Papiere für Doktoratsbewerbungen.

education hiring research machine learning

RESEARCH↑ trendingReddit r/MachineLearning·vor 19T

Novel Problems in VLA [R]

Ein Forschungsstudent sucht Ratschläge zur Entwicklung neuartiger Forschungsideen im Bereich VLA, da er das Feld als gesättigt empfindet. Er hatte eine Idee umgesetzt, nur um festzustellen, dass diese bereits veröffentlicht wurde, und sucht nun nach neuen Ansätzen für sein Projekt.

research AI research challenges VLA novelty

RESEARCH↑ trendingReddit r/MachineLearning·5/5/2026

Struggling to reproduce paper results before improving them — stuck below reported accuracy [R]

Ein Doktorand in KI/Computer Vision hat Schwierigkeiten, die in einem veröffentlichten Papier berichtete Genauigkeit zu reproduzieren, und erreicht konsequent etwa 73% gegenüber der Baselinie des Papiers von ~77%. Trotz sorgfältiger Überprüfungen und Kontaktversuchen mit den Autoren stößt der Student auf eine Reproduktionslücke, die weitere Forschungsarbeiten behindert.

research PhD student machine learning computer vision

RESEARCHarXiv CS.CL·vor 1T

How Language Models Fail: Token-Level Signatures of Committed and Persistent Reasoning Failures

Fehler im Sprachmodell-Denken entstehen durch unterschiedliche Prozesse, die identifizierbare Token-Level-Signaturen hinterlassen. Diese Fehler werden als „festgelegter Fehler“ oder „anhaltende Unsicherheit“ charakterisiert, und das Verständnis dieser Signaturen hilft, fehlerhafte von erfolgreichen Vervollständigungen in verschiedenen Konfigurationen zu unterscheiden.

language models research Reasoning AI failures

NEWSOpenAI Blog·vor 2T

Introducing the OpenAI Economic Research Exchange

OpenAI hat den Economic Research Exchange ins Leben gerufen, um die Auswirkungen von KI auf Arbeitsplätze, Produktivität und die Wirtschaft zu untersuchen. Bewerbungen für ausgewählte Forschungsprojekte sind ab sofort möglich.

future-of-work OpenAI research AI

DOC↑ trendingReddit r/MachineLearning·vor 28T

How do you create memorable poster for top tier conferences ( ICML/ICLR/NEURips ect…) [D]

Ein Benutzer, der zum ersten Mal auf einer hochrangigen Konferenz (ICML/ICLR/NeurIPS) präsentiert, hat Schwierigkeiten mit dem Posterdesign, findet seine Versuche basic und stößt auf Probleme mit der Größe und den Druckkosten. Er sucht Designtipps, Softwareempfehlungen (PowerPoint vs. Canvas) und allgemeine Ratschläge, um ein einprägsames Poster für einen theorieorientierten Artikel zu erstellen.

research learning poster design academic presentation