AI Research

146 items

RESEARCHDEV.to AI·vor 10Std

Aligning with Human Judgement: The Role of Pairwise Preference in Large LanguageModel Evaluators

Dieser Inhalt untersucht die entscheidende Rolle der Paarpräferenz bei der Bewertung großer Sprachmodelle (LLMs). Er diskutiert, wie diese Methode dazu beitragen kann, die LLM-Leistung effektiver an menschliche Urteile anzupassen.

Human Alignment Pairwise Preference natural language processing AI Research

RESEARCHarXiv CS.AI·vor 19Std

Why Limit the Residual Stream to Layers and Not Tokens? Persistent Memory for Continuous Latent Reasoning

Große Sprachmodelle (LLMs) stoßen auf eine Einschränkung namens 'Konzept-Engpass', bei der sie kritische Fakten in tiefen latenten Schlussfolgerungen verlieren. Dieses Papier schlägt AGCLR vor, um dies zu beheben, indem CoCoNuT mit einem Gated Concept Stream für persistenten Speicher erweitert wird.

machine learning Latent Reasoning Reasoning AI Research

RESEARCHarXiv CS.CL·vor 19Std

Bidirectional Small-Granularity Search between Code and Text

Diese Forschung stellt eine neue Aufgabe vor: die bidirektionale Suche mit kleiner Granularität zwischen Code und Text, die wissenschaftliche Publikationen mit entsprechenden Codesegmenten verknüpfen soll. Sie schlägt einen großen Datensatz vor, teilweise generiert von GPT-4, und einen modularen Ansatz, der gute Ergebnisse erzielt.

machine learning natural language processing Code Analysis Information Retrieval

RESEARCHarXiv CS.CL·vor 19Std

GraphLoRA: Structure-Aware Low-Rank Adaptation for Large Language Model Recommendation

GraphLoRA schlägt ein neuartiges Framework für die Empfehlung mittels großer Sprachmodelle (LLMRec) vor, das strukturelle Informationen mit textueller Semantik integriert. Dies wird durch die Einbettung eines trainierbaren Graphen-Nachrichtenübertragungsnetzwerks in den Low-Rank-Adaptationspfad erreicht, wodurch die kollaborative Topologie Parameter-Updates explizit steuern kann.

Low-Rank Adaptation Graph Neural Networks Recommendation Systems AI Research

ARTICLE↑ trendingHacker News (AI)·vor 4T

Sakana AI's Recursive Self-Improvement (RSI) Lab

Sakana AI hat ihr Labor für Rekursive Selbstverbesserung (RSI) eröffnet, um KI-Modelle zu entwickeln, die ihre eigene Leistung verbessern können. Diese Initiative konzentriert sich auf Grundlagenforschung, um robustere und anpassungsfähigere KI-Systeme zu schaffen.

Self-improvement AI Sakana AI machine learning AI development

ARTICLE↑ trendingHacker News (AI)·vor 4T

Ask HN: AI researchers – what's a recent paper that recently blew your mind?

Ein Hacker News-Benutzer fordert KI-Forscher auf, aktuelle Machine-Learning-Artikel zu teilen, die sie beeindruckt haben. Ziel ist es, neue und spannende Veröffentlichungen im ML-Bereich für diejenigen zu finden, die ständig auf der Suche nach Neuheiten sind.

Academic Papers Research Recommendations machine learning AI

RESEARCH↑ trendingReddit r/MachineLearning·vor 27T

Learning, Fast and Slow: Towards LLMs That Adapt Continually [R]

Große Sprachmodelle (LLMs) sind mit katastrophalem Vergessen und Plastizitätsverlust konfrontiert, wenn sie ihre Parameter für nachgelagerte Aufgaben aktualisieren. Diese Arbeit stellt ein "schnell-langsam"-Lernframework für LLMs vor, das Modellparameter als langsame Gewichte und optimierten Kontext als schnelle Gewichte nutzt, um sich effizient anzupassen, ohne das allgemeine Denkvermögen zu beeinträchtigen.

LLMs learning Catastrophic Forgetting AI Research

ARTICLE↑ trendingReddit r/MachineLearning·4/20/2026

SGOCR: A Spatially-Grounded OCR-focused Pipeline & V1 Dataset [P]

Ein unabhängiger Forscher entwickelte SGOCR, eine quelloffene Dataset-Pipeline für räumlich geerdetes, OCR-fokussiertes VQA, um eine Lücke in visuellen Datensätzen für die Textverankerung in Bildern zu schließen. Diese Pipeline generiert VQA-Tupel mit reichhaltigen Metadaten, die diverse VLM-Trainingsstrategien unterstützen.

Open Source Vision-Language Models datasets OCR

ARTICLE↑ trendingReddit r/MachineLearning·4/12/2026

LLMs learn backwards, and the scaling hypothesis is bounded. [D]

Dieser Inhalt erörtert die Ansicht, dass Large Language Models (LLMs) invers lernen und die Skalierbarkeitshypothese inhärente Grenzen aufweist.

LLMs deep learning scaling hypothesis modelos de linguagem

RESEARCH↑ trendingReddit r/MachineLearning·vor 26T

Follow the Mean: Reference-Guided Flow Matching [R]

Dieser Inhalt bezieht sich auf einen Forschungsartikel mit dem Titel "Follow the Mean: Reference-Guided Flow Matching". Er untersucht eine neue Methodik in generativen Modellen.

deep learning generative models machine learning Flow Matching

Follow the Mean: Reference-Guided Flow Matching [R]

ARTICLE↑ trendingReddit r/MachineLearning·4/30/2026

Seems ICML is rejecting MANY unanimous positively rated papers [D]

Der Inhalt beschreibt eine wahrgenommene Fehlausrichtung im ICML-Begutachtungsprozess, bei der Gutachter sich unter Druck gesetzt fühlen, Bewertungen zu homogenisieren, um langwierige Diskussionen zu vermeiden, was zur Ablehnung positiv bewerteter Artikel führen kann. Es wird die Zurückhaltung der Gutachter hervorgehoben, ihre Bewertungen auch nach Klärung von Bedenken zu aktualisieren, was zu verzerrten Dynamiken führt.

Peer review academic conference AI Research

RESEARCH↑ trendingReddit r/MachineLearning·vor 19T

Do VLMs in production still use fixed-patch ViTs for their vision capabilities? [D]

Diese Diskussion hinterfragt, ob Produktions-Vision-Language-Modelle (VLMs) trotz effizienterer Tokenisierungsverfahren immer noch fest gepatchte Vision Transformer (ViTs) für ihre Sehfähigkeiten verwenden. Es werden mögliche Gründe dafür untersucht, wie marginale Gewinne, Pipeline-Einschränkungen oder unklare Skalierungsgesetze für adaptives Patching.

VLMs deep learning Vision Transformers Tokenization

ARTICLE↑ trendingReddit r/MachineLearning·4/20/2026

Are we optimizing AI research for acceptance rather than lasting value? [D]

Der Titel hinterfragt, ob die KI-Forschung auf sofortige Akzeptanz statt auf dauerhaften Wert optimiert wird. Dies regt eine kritische Diskussion über die Richtung und die Prioritäten der Innovation in der künstlichen Intelligenz an.

Innovation Research methodology long-term value AI Research

NEWS↑ trendingReddit r/MachineLearning·4/19/2026

KDD 2026 Cycle 2 reviews seem to have vanished from author view [D]

Ein KDD 2026-Benutzer bemerkte, dass die Begutachtungen und Diskussionen zu seinem eingereichten Papier aus der Autorenansicht verschwunden sind, während er in der Gutachteransicht noch Diskussionen anderer Papiere sehen kann. Er fragt, ob andere Autoren dasselbe technische Problem mit der Begutachtungsplattform feststellen.

KDD Peer review academic conference AI Research

RESEARCHarXiv CS.CL·vor 1T

The Piggyback Hypothesis of Generalization: Explaining and Mitigating Emergent Misalignment

Die Piggyback-Hypothese erklärt, wie Chat-Template-Token in LLMs zu emergentem Fehlverhalten führen können, indem sie feinabgestimmtes Verhalten auf Out-of-Domain-Anfragen übertragen. Die Token-Regularized Finetuning (TReFT)-Methode wird vorgeschlagen, um dieses Problem zu mindern, wobei das In-Domain-Lernen erhalten bleibt und das Fehlverhalten reduziert wird.

Finetuning Emergent Misalignment LLMs Generalization

ARTICLE↑ trendingReddit r/MachineLearning·vor 26T

Would a 2000-2021 ML paper even get accepted today? [D]

Der Inhalt diskutiert, ob Machine-Learning-Arbeiten, die zwischen 2000 und 2021 akzeptiert wurden, heute noch angenommen würden, was darauf hindeutet, dass die Messlatte für Veröffentlichungen erheblich gestiegen ist. Es wird debattiert, ob die Forschungsstandards wirklich höher sind oder ob das Feld einfach überfüllter und wettbewerbsintensiver geworden ist.

machine learning competition Peer review academic research

ARTICLE↑ trendingReddit r/MachineLearning·4/18/2026

ICML 2026 - Heavy score variance among various batches? [D]

Ein Reddit-Beitrag diskutiert erhebliche Punkteschwankungen zwischen den Paper-Batches für ICML 2026, wobei einige Batches wenige hohe Bewertungen aufweisen, während andere höhere Durchschnitte melden. Der Nutzer hinterfragt die Gründe für diese Disparität, wie Domänenunterschiede oder strengere Gutachter, und ob ICML dies berücksichtigt.

academic conferences Peer review AI Research

ARTICLE↑ trendingReddit r/MachineLearning·4/27/2026

What do reviewers actually mean when they say the paper sound more like a technical report? [D]

Der Artikel eines Autors wurde von einem Workshop abgelehnt, weil er eher wie ein technischer Bericht als ein Forschungspapier klang, obwohl er das übliche Computer-Vision-Format befolgte. Er bittet die Gemeinschaft um ihre Meinung, um häufige Fehler zu verstehen, die zu einer solchen Bewertung führen.

academic publishing computer vision Peer review AI Research

ARTICLE↑ trendingReddit r/MachineLearning·4/19/2026

What are the future prospects of Spiking Neural Networks (and particularly, neuromorphics computing) and Liquid Neural Networks? [D]

Ein Bachelorstudent erkundigt sich nach den Zukunftsaussichten und der Mainstream-Akzeptanz von Spiking Neural Networks und Liquid Neural Networks, und ob diese vielversprechende Bereiche für das Lernen und Projekte sind. Er möchte das Potenzial dieser neuromorphen Computertechnologien diskutieren.

Spiking Neural Networks deep learning Liquid Neural Networks Neuromorphic Computing

NEWS↑ trendingReddit r/MachineLearning·4/23/2026

UAI 2026 Reviews Waiting Place [D]

Dies ist ein Ort für UAI 2026-Teilnehmer, um ihre Reaktionen – ob Beschwerden oder Erleichterung – zu teilen, sobald die Konferenzbewertungen bald veröffentlicht werden. Allen wird viel Glück mit ihren Ergebnissen gewünscht.

conferences Peer review AI Research