AI Research

146 items

ARTICLE↑ trendingReddit r/MachineLearning·4/17/2026

SIGIR-AP: Good conference for IR? [D]

Ein studentischer Forscher, der sich für Information Retrieval (IR) interessiert, sucht Rat bezüglich weniger kompetitiver akademischer Konferenzen zur Einreichung. Er fragt insbesondere nach SIGIR-AP, einer neuen von SIGIR unterstützten Konferenz, und nach weiteren geeigneten Optionen.

research academic conferences Information Retrieval AI Research

ARTICLE↑ trendingReddit r/MachineLearning·4/11/2026

Post Rebuttal ICML Average Scores? [D]

Ein Autor drückt seine Frustration über den ICML-Begutachtungsprozess aus, wobei er einen Durchschnittswert von 3,5 und eine geänderte Gutachterbewertung hervorhebt. Er merkt an, dass ein Score von 4,2 laut „Paper Co-Pilot“ ein Paper immer noch nur in die oberen 40 % einordnet.

Academic Publication Paper Co-Pilot paper review ICML

ARTICLE↑ trendingReddit r/MachineLearning·4/20/2026

Does submitting to only journals negatively affect research career after finishing PhD? [D]

Der Inhalt hinterfragt, ob das ausschließliche Veröffentlichen in ML-Journalen (z.B. TMLR, JMLR) anstatt auf Konferenzen die Jobaussichten für ML-Forschungswissenschaftler in Unternehmen negativ beeinflusst, angesichts der vermeintlich faireren Begutachtungsprozesse der Journale. Die Diskussion konzentriert sich auf Unternehmenskarrieren nach dem Doktorat.

hiring AI Research

NEWS↑ trendingReddit r/MachineLearning·4/12/2026

"There's a new generation of empirical deep learning researchers, hacking away at whatever seems trendy, blowing with the wind" [D]

Der Inhalt kritisiert die neue Generation von Deep-Learning-Forschern dafür, Trends zu folgen. Der Autor sucht eine Diskussion über den komplexen Begriff „post-agentische KI“, mit dem er Schwierigkeiten hat.

AI trends deep learning post-agentic AI AI concepts

ARTICLE↑ trendingReddit r/MachineLearning·4/21/2026

[NeurIPS 2026] Will you be submitting your code alongside your submissions? [D]

Dieser Inhalt diskutiert die Einreichung von Code zusammen mit Papieren für NeurIPS 2026, wobei der Autor zwischen dem Glaubwürdigkeitsgewinn und Plagiatsbedenken hin- und hergerissen ist. Der Beitrag fragt nach den Meinungen der Gemeinschaft zu dieser Praxis.

code submission academic-ethics plagiarism research integrity

ARTICLE↑ trendingReddit r/MachineLearning·4/16/2026

[ICML 2026] Scores increased and then decreased!! [D]

Ein Autor eines ICML-Papers ist besorgt, weil ein Gutachter seine Bewertung nach der Replik erhöht, diese dann aber wieder auf den ursprünglichen Wert reduziert hat. Der Rückgang des durchschnittlichen Scores des Papers lässt sie eine frühe Ablehnung befürchten.

Peer review academic conference AI Research

ARTICLE↑ trendingReddit r/MachineLearning·5/1/2026

ICML 2026 Position Track Decision [D]

Der Benutzer schlägt vor, einen separaten Diskussions-Thread für den 'Position Track' der ICML 2026 zu erstellen, da er befürchtet, dass Diskussionen zu diesem Nischen-Track im Haupt-Diskussions-Track untergehen könnten. Ziel ist es, Entscheidungsfindungen bezüglich dieses spezifischen Tracks zu erleichtern.

machine learning academic discourse Conference AI Research

ARTICLE↑ trendingReddit r/MachineLearning·4/13/2026

[ICML 2026] Extending the deadline for reviewer final justifications while not extending for Author-AC comments was a huge mistake [D]

Der Autor kritisiert die Entscheidung, die Frist für die finalen Begründungen der Gutachter bei der ICML 2026 zu verlängern, ohne die Frist für Autoren zur Kontaktaufnahme mit den ACs ebenfalls zu verlängern, und hält dies für einen erheblichen Fehler. Ein Gutachter hat in seiner finalen Begründung neue, kritische Probleme aufgeworfen, die zuvor nicht erwähnt wurden und die ein Paper gefährden könnten, das ansonsten starke Bewertungen erhalten hat.

deadlines ICML Peer review academic conference

RESEARCHarXiv CS.CL·4/22/2026

Remask, Don't Replace: Token-to-Mask Refinement in Masked Diffusion Language Models

Dieses Papier schlägt eine neue Technik, das Token-to-Mask (T2M) Remasking, zur Verfeinerung maskierter Diffusions-Sprachmodelle wie LLaDA2.1 vor. Die Methode behebt die Mängel der Token-to-Token (T2T)-Bearbeitung, indem sie verdächtige Token in einen Maskierungszustand zurücksetzt, was eine genauere Neuprädiktion ermöglicht.

Diffusion Models language models error correction Natural Language Processing

RESEARCHarXiv CS.CL·vor 14T

Multi-Persona Debate System for Automated Scientific Hypothesis Generation

Das Multi-Persona Debate System (MPDS) ist ein literaturgestütztes Framework zur automatisierten Generierung wissenschaftlicher Hypothesen, das die Herausforderung der Synthese fragmentierten Wissens, insbesondere in der Batteriematerialforschung, adressiert. Es kombiniert Literaturrecherche, Reasoning großer Sprachmodelle und Multi-Agenten-Debatten, um Verhandlungen zwischen Personas bei gleichzeitiger Sicherstellung der Nachvollziehbarkeit der Evidenz zu ermöglichen.

Materials Science Scientific Discovery multi-agent systems AI Research

RESEARCHDEV.to AI·4/18/2026

Density-aware Chamfer Distance as a Comprehensive Metric for Point CloudCompletion

Dieser Inhalt stellt die „Density-aware Chamfer Distance“ als neue umfassende Metrik zur Bewertung von Punktwolken-Vervollständigungsaufgaben vor. Ziel ist es, eine robustere und genauere Beurteilung von vervollständigten 3D-Modellen zu ermöglichen.

3D reconstruction point cloud Metrics computer vision

RESEARCHarXiv CS.CL·4/23/2026

Do Hallucination Neurons Generalize? Evidence from Cross-Domain Transfer in LLMs

Neue Forschungsergebnisse deuten darauf hin, dass „Halluzinationsneuronen“ (H-Neuronen), die LLM-Halluzinationen vorhersagen, nicht über verschiedene Wissensdomänen hinweg verallgemeinerbar sind. Dies deutet darauf hin, dass Halluzination möglicherweise kein einzelner Mechanismus mit einer universellen neuronalen Signatur ist, sondern kontextabhängig.

LLMs hallucination AI safety AI Research

RESEARCHDEV.to AI·4/13/2026

Beyond the 80/20 Rule: High-Entropy Minority Tokens Drive EffectiveReinforcement Learning for LLM Reasoning

Dieser Inhalt untersucht einen neuartigen Ansatz zur Verbesserung des Reinforcement Learnings für die Argumentation von Großen Sprachmodellen (LLM) durch die Konzentration auf „high-entropy minority tokens“. Es wird vorgeschlagen, dass diese selteneren, aber hoch informativen Token Schlüsselfaktoren für effektives Lernen sind und die konventionelle 80/20-Regel in Frage stellen.

Token Analysis reinforcement learning Natural Language Processing LLM reasoning

RESEARCHarXiv CS.CL·vor 13T

Self-Verified Distillation: Your Language Model Is Secretly Its Own Synthetic Data Pipeline

Diese Forschung stellt die Selbst-Verifizierte Destillation vor, einen Algorithmus, der großen Sprachmodellen (LLMs) ermöglicht, sich nur mit unbeschrifteten Prompts selbst zu verbessern. Dies beinhaltet das Generieren, Selbst-Verifizieren durch mehrstufige Prüfungen und das Trainieren auf selbstkuratierten Datensätzen, ohne externe Lehrer.

distillation learning self-training AI Research

RESEARCHarXiv CS.CL·vor 19T

Data Scaling as Progressive Coverage of a Predictive Contribution Spectrum

Diese Forschung untersucht, ob reale Datenskalierungsgesetze durch eine progressive Abdeckung eines latenten prädiktiven Beitragsspektrums und nicht nur durch die Token-Frequenz bestimmt werden. Mithilfe eines Suffix-Automaten und eines globalen KL-Prädiktionsbeitragsspektrums findet die Studie eine starke Korrelation zwischen der Steigung des Spektrumsendes und dem Daten-Skalierungsexponenten von GPT-Lernenden, was zeigt, dass der effektive Trunkierungsrang logarithmisch skaliert.

language models data scaling machine learning predictive models

RESEARCHarXiv CS.LG·5/7/2026

Structured Progressive Knowledge Activation for LLM-Driven Neural Architecture Search

Dieses Papier stellt Structured Progressive Knowledge Activation (SPARK) vor, um die Herausforderung der Integration architektonischen Wissens in die LLM-gesteuerte neuronale Architektursuche (NAS) zu bewältigen. SPARK mindert "funktionale Verflechtung" durch faktorkonditioniertes Bearbeiten, was zu zielgerichteteren und zuverlässigeren Architekturmodifikationen führt.

Neural Architecture Search machine learning Knowledge Integration large language models

RESEARCHDEV.to AI·vor 4T

Remember to be Curious: Episodic Context and Persistent Worlds for 3D Exploration

Dieser Inhalt analysiert einen Forschungsartikel, der sich auf die Nutzung von episodischem Kontext und persistenten Welten für die 3D-Erkundung in KI-Systemen konzentriert. Er weist auf eine relevante Verschiebung im Bereich der künstlichen Intelligenz hin, gestützt auf Daten und Analysen.

persistent worlds episodic context AI Research 3D exploration

RESEARCHarXiv CS.LG·5/8/2026

Structural Instability of Feature Composition

Diese Arbeit stellt einen geometrischen Rahmen zur Analyse der Instabilität von Merkmalsvereinigungen in Sparse Autoencodern (SAEs vor, insbesondere im Hinblick auf die Kompositionslenkung. Sie leitet eine asymptotische Kompositionskollaps-Schwelle unter einem sphärischen Wörterbuchmodell ab.

Feature Composition Transformer architectures Sparse autoencoders AI Research

RESEARCHarXiv CS.AI·vor 29T

When Does a Language Model Commit? A Finite-Answer Theory of Pre-Verbalization Commitment

Diese Forschung führt eine Theorie der "Stabilisierung der endlichen Antwortpräferenz" ein, um zu bestimmen, wann die Antwortpräferenz eines Sprachmodells stabil wird. Es zeigt sich, dass diese Stabilisierung oft vor der verbalisierbaren Antwort erfolgt, mit einem deutlichen Vorlauf.

language models cognitive science machine learning NLP

RESEARCHarXiv CS.LG·vor 29T

RateQuant: Optimal Mixed-Precision KV Cache Quantization via Rate-Distortion Theory

Dieses Papier stellt RateQuant vor, eine Methode zur optimalen gemischt-präzisen KV-Cache-Quantisierung in großen Sprachmodellen, um Speicherengpässe zu beheben. Es befasst sich mit dem Problem der Diskrepanz des Distorsionsmodells, bei dem die Anwendung des Distorsionsmodells eines Quantisierers auf einen anderen die Leistung im Vergleich zur gleichmäßigen Quantisierung verschlechtert.

Memory Optimization quantization AI Research LLM