← heapsort-ai

AI Research

146 items

ARTICLE↑ trendingReddit r/MachineLearning·4/20/2026

Does submitting to only journals negatively affect research career after finishing PhD? [D]

Der Inhalt hinterfragt, ob das ausschließliche Veröffentlichen in ML-Journalen (z.B. TMLR, JMLR) anstatt auf Konferenzen die Jobaussichten für ML-Forschungswissenschaftler in Unternehmen negativ beeinflusst, angesichts der vermeintlich faireren Begutachtungsprozesse der Journale. Die Diskussion konzentriert sich auf Unternehmenskarrieren nach dem Doktorat.

36
ARTICLE↑ trendingReddit r/MachineLearning·5/1/2026

ICML 2026 Position Track Decision [D]

Der Benutzer schlägt vor, einen separaten Diskussions-Thread für den 'Position Track' der ICML 2026 zu erstellen, da er befürchtet, dass Diskussionen zu diesem Nischen-Track im Haupt-Diskussions-Track untergehen könnten. Ziel ist es, Entscheidungsfindungen bezüglich dieses spezifischen Tracks zu erleichtern.

33
ARTICLE↑ trendingReddit r/MachineLearning·4/13/2026

[ICML 2026] Extending the deadline for reviewer final justifications while not extending for Author-AC comments was a huge mistake [D]

Der Autor kritisiert die Entscheidung, die Frist für die finalen Begründungen der Gutachter bei der ICML 2026 zu verlängern, ohne die Frist für Autoren zur Kontaktaufnahme mit den ACs ebenfalls zu verlängern, und hält dies für einen erheblichen Fehler. Ein Gutachter hat in seiner finalen Begründung neue, kritische Probleme aufgeworfen, die zuvor nicht erwähnt wurden und die ein Paper gefährden könnten, das ansonsten starke Bewertungen erhalten hat.

33
RESEARCHarXiv CS.CL·4/22/2026

Remask, Don't Replace: Token-to-Mask Refinement in Masked Diffusion Language Models

Dieses Papier schlägt eine neue Technik, das Token-to-Mask (T2M) Remasking, zur Verfeinerung maskierter Diffusions-Sprachmodelle wie LLaDA2.1 vor. Die Methode behebt die Mängel der Token-to-Token (T2T)-Bearbeitung, indem sie verdächtige Token in einen Maskierungszustand zurücksetzt, was eine genauere Neuprädiktion ermöglicht.

32
RESEARCHarXiv CS.CL·vor 14T

Multi-Persona Debate System for Automated Scientific Hypothesis Generation

Das Multi-Persona Debate System (MPDS) ist ein literaturgestütztes Framework zur automatisierten Generierung wissenschaftlicher Hypothesen, das die Herausforderung der Synthese fragmentierten Wissens, insbesondere in der Batteriematerialforschung, adressiert. Es kombiniert Literaturrecherche, Reasoning großer Sprachmodelle und Multi-Agenten-Debatten, um Verhandlungen zwischen Personas bei gleichzeitiger Sicherstellung der Nachvollziehbarkeit der Evidenz zu ermöglichen.

32
RESEARCHarXiv CS.CL·4/23/2026

Do Hallucination Neurons Generalize? Evidence from Cross-Domain Transfer in LLMs

Neue Forschungsergebnisse deuten darauf hin, dass „Halluzinationsneuronen“ (H-Neuronen), die LLM-Halluzinationen vorhersagen, nicht über verschiedene Wissensdomänen hinweg verallgemeinerbar sind. Dies deutet darauf hin, dass Halluzination möglicherweise kein einzelner Mechanismus mit einer universellen neuronalen Signatur ist, sondern kontextabhängig.

30
RESEARCHDEV.to AI·4/13/2026

Beyond the 80/20 Rule: High-Entropy Minority Tokens Drive EffectiveReinforcement Learning for LLM Reasoning

Dieser Inhalt untersucht einen neuartigen Ansatz zur Verbesserung des Reinforcement Learnings für die Argumentation von Großen Sprachmodellen (LLM) durch die Konzentration auf „high-entropy minority tokens“. Es wird vorgeschlagen, dass diese selteneren, aber hoch informativen Token Schlüsselfaktoren für effektives Lernen sind und die konventionelle 80/20-Regel in Frage stellen.

29
RESEARCHarXiv CS.CL·vor 13T

Self-Verified Distillation: Your Language Model Is Secretly Its Own Synthetic Data Pipeline

Diese Forschung stellt die Selbst-Verifizierte Destillation vor, einen Algorithmus, der großen Sprachmodellen (LLMs) ermöglicht, sich nur mit unbeschrifteten Prompts selbst zu verbessern. Dies beinhaltet das Generieren, Selbst-Verifizieren durch mehrstufige Prüfungen und das Trainieren auf selbstkuratierten Datensätzen, ohne externe Lehrer.

29
RESEARCHarXiv CS.CL·vor 19T

Data Scaling as Progressive Coverage of a Predictive Contribution Spectrum

Diese Forschung untersucht, ob reale Datenskalierungsgesetze durch eine progressive Abdeckung eines latenten prädiktiven Beitragsspektrums und nicht nur durch die Token-Frequenz bestimmt werden. Mithilfe eines Suffix-Automaten und eines globalen KL-Prädiktionsbeitragsspektrums findet die Studie eine starke Korrelation zwischen der Steigung des Spektrumsendes und dem Daten-Skalierungsexponenten von GPT-Lernenden, was zeigt, dass der effektive Trunkierungsrang logarithmisch skaliert.

29
RESEARCHarXiv CS.LG·5/7/2026

Structured Progressive Knowledge Activation for LLM-Driven Neural Architecture Search

Dieses Papier stellt Structured Progressive Knowledge Activation (SPARK) vor, um die Herausforderung der Integration architektonischen Wissens in die LLM-gesteuerte neuronale Architektursuche (NAS) zu bewältigen. SPARK mindert "funktionale Verflechtung" durch faktorkonditioniertes Bearbeiten, was zu zielgerichteteren und zuverlässigeren Architekturmodifikationen führt.

29
RESEARCHarXiv CS.LG·vor 29T

RateQuant: Optimal Mixed-Precision KV Cache Quantization via Rate-Distortion Theory

Dieses Papier stellt RateQuant vor, eine Methode zur optimalen gemischt-präzisen KV-Cache-Quantisierung in großen Sprachmodellen, um Speicherengpässe zu beheben. Es befasst sich mit dem Problem der Diskrepanz des Distorsionsmodells, bei dem die Anwendung des Distorsionsmodells eines Quantisierers auf einen anderen die Leistung im Vergleich zur gleichmäßigen Quantisierung verschlechtert.

29