← heapsort-ai

AI Research

146 items

RESEARCHarXiv CS.CL·vor 19Std

Bidirectional Small-Granularity Search between Code and Text

Diese Forschung stellt eine neue Aufgabe vor: die bidirektionale Suche mit kleiner Granularität zwischen Code und Text, die wissenschaftliche Publikationen mit entsprechenden Codesegmenten verknüpfen soll. Sie schlägt einen großen Datensatz vor, teilweise generiert von GPT-4, und einen modularen Ansatz, der gute Ergebnisse erzielt.

54
RESEARCHarXiv CS.CL·vor 19Std

GraphLoRA: Structure-Aware Low-Rank Adaptation for Large Language Model Recommendation

GraphLoRA schlägt ein neuartiges Framework für die Empfehlung mittels großer Sprachmodelle (LLMRec) vor, das strukturelle Informationen mit textueller Semantik integriert. Dies wird durch die Einbettung eines trainierbaren Graphen-Nachrichtenübertragungsnetzwerks in den Low-Rank-Adaptationspfad erreicht, wodurch die kollaborative Topologie Parameter-Updates explizit steuern kann.

54
RESEARCH↑ trendingReddit r/MachineLearning·vor 27T

Learning, Fast and Slow: Towards LLMs That Adapt Continually [R]

Große Sprachmodelle (LLMs) sind mit katastrophalem Vergessen und Plastizitätsverlust konfrontiert, wenn sie ihre Parameter für nachgelagerte Aufgaben aktualisieren. Diese Arbeit stellt ein "schnell-langsam"-Lernframework für LLMs vor, das Modellparameter als langsame Gewichte und optimierten Kontext als schnelle Gewichte nutzt, um sich effizient anzupassen, ohne das allgemeine Denkvermögen zu beeinträchtigen.

42
ARTICLE↑ trendingReddit r/MachineLearning·4/30/2026

Seems ICML is rejecting MANY unanimous positively rated papers [D]

Der Inhalt beschreibt eine wahrgenommene Fehlausrichtung im ICML-Begutachtungsprozess, bei der Gutachter sich unter Druck gesetzt fühlen, Bewertungen zu homogenisieren, um langwierige Diskussionen zu vermeiden, was zur Ablehnung positiv bewerteter Artikel führen kann. Es wird die Zurückhaltung der Gutachter hervorgehoben, ihre Bewertungen auch nach Klärung von Bedenken zu aktualisieren, was zu verzerrten Dynamiken führt.

42
RESEARCH↑ trendingReddit r/MachineLearning·vor 19T

Do VLMs in production still use fixed-patch ViTs for their vision capabilities? [D]

Diese Diskussion hinterfragt, ob Produktions-Vision-Language-Modelle (VLMs) trotz effizienterer Tokenisierungsverfahren immer noch fest gepatchte Vision Transformer (ViTs) für ihre Sehfähigkeiten verwenden. Es werden mögliche Gründe dafür untersucht, wie marginale Gewinne, Pipeline-Einschränkungen oder unklare Skalierungsgesetze für adaptives Patching.

42
RESEARCHarXiv CS.CL·vor 1T

The Piggyback Hypothesis of Generalization: Explaining and Mitigating Emergent Misalignment

Die Piggyback-Hypothese erklärt, wie Chat-Template-Token in LLMs zu emergentem Fehlverhalten führen können, indem sie feinabgestimmtes Verhalten auf Out-of-Domain-Anfragen übertragen. Die Token-Regularized Finetuning (TReFT)-Methode wird vorgeschlagen, um dieses Problem zu mindern, wobei das In-Domain-Lernen erhalten bleibt und das Fehlverhalten reduziert wird.

41
ARTICLE↑ trendingReddit r/MachineLearning·vor 26T

Would a 2000-2021 ML paper even get accepted today? [D]

Der Inhalt diskutiert, ob Machine-Learning-Arbeiten, die zwischen 2000 und 2021 akzeptiert wurden, heute noch angenommen würden, was darauf hindeutet, dass die Messlatte für Veröffentlichungen erheblich gestiegen ist. Es wird debattiert, ob die Forschungsstandards wirklich höher sind oder ob das Feld einfach überfüllter und wettbewerbsintensiver geworden ist.

41
ARTICLE↑ trendingReddit r/MachineLearning·4/18/2026

ICML 2026 - Heavy score variance among various batches? [D]

Ein Reddit-Beitrag diskutiert erhebliche Punkteschwankungen zwischen den Paper-Batches für ICML 2026, wobei einige Batches wenige hohe Bewertungen aufweisen, während andere höhere Durchschnitte melden. Der Nutzer hinterfragt die Gründe für diese Disparität, wie Domänenunterschiede oder strengere Gutachter, und ob ICML dies berücksichtigt.

41
ARTICLE↑ trendingReddit r/MachineLearning·4/27/2026

What do reviewers actually mean when they say the paper sound more like a technical report? [D]

Der Artikel eines Autors wurde von einem Workshop abgelehnt, weil er eher wie ein technischer Bericht als ein Forschungspapier klang, obwohl er das übliche Computer-Vision-Format befolgte. Er bittet die Gemeinschaft um ihre Meinung, um häufige Fehler zu verstehen, die zu einer solchen Bewertung führen.

38
ARTICLE↑ trendingReddit r/MachineLearning·4/19/2026

What are the future prospects of Spiking Neural Networks (and particularly, neuromorphics computing) and Liquid Neural Networks? [D]

Ein Bachelorstudent erkundigt sich nach den Zukunftsaussichten und der Mainstream-Akzeptanz von Spiking Neural Networks und Liquid Neural Networks, und ob diese vielversprechende Bereiche für das Lernen und Projekte sind. Er möchte das Potenzial dieser neuromorphen Computertechnologien diskutieren.

38
NEWS↑ trendingReddit r/MachineLearning·4/23/2026

UAI 2026 Reviews Waiting Place [D]

Dies ist ein Ort für UAI 2026-Teilnehmer, um ihre Reaktionen – ob Beschwerden oder Erleichterung – zu teilen, sobald die Konferenzbewertungen bald veröffentlicht werden. Allen wird viel Glück mit ihren Ergebnissen gewünscht.

37