← heapsort-ai

AI Research

146 items

RESEARCHarXiv CS.CL·vor 7T

SENSE: Semantic Embedding Navigation with Soft-gated Evaluation for Retrieval-based Speculative Decoding

Dieses Papier schlägt SENSE (Semantic Embedding Navigation with Soft-gated Evaluation) vor, um Retrieval-basierte Spekulative Dekodierung (RSD) für LLMs zu verbessern. SENSE adressiert die starren lexikalischen Abhängigkeiten von RSD, indem es robuste semantische Ausrichtung und ein Soft-gated Evaluationsmodul verwendet, um semantische Äquivalenz zu validieren.

29
ARTICLE↑ trendingReddit r/MachineLearning·4/16/2026

Camera-ready paranoia [D]

Nach der Einreichung ihres Papiers bei CVPRW verspürt ein Benutzer eine „camera-ready Paranoia“ und befürchtet trotz der Verwendung eines PDF-Validierungstools und der korrekten Vorlage eine Ablehnung aufgrund möglicher Fehler. Sie suchen Bestätigung, wann das Papier in die Tagungsband aufgenommen wird, und weisen auf den aktuellen Status „In Produktion“ hin.

29
RESEARCHarXiv CS.CL·4/6/2026

PolyJarvis: LLM Agent for Autonomous Polymer MD Simulations

PolyJarvis é um agente LLM que automatiza simulações de dinâmica molecular de polímeros para prever propriedades a partir de linguagem natural, utilizando a plataforma RadonPy. O sistema executa tarefas desde a construção do monômero até o cálculo de propriedades, mostrando previsões precisas de densidade e módulos de elasticidade para polímeros como aPS e PMMA.

29
RESEARCHarXiv CS.CL·vor 5T

Discourse-Role Labels as Presentation-Time Variables for Context Use in Language Models

Diese Studie untersucht den Einfluss von Diskursrollen-Etiketten wie "Referenz" oder "Anweisung" auf das Verhalten von Sprachmodellen. Es zeigt sich, dass sich die Adoptionsrate irreführender Informationen je nach Etikett erheblich verschieben kann (56-84 Prozentpunkte), wobei Etiketten wie "Anweisung" die Adoption erhöhen und "Beispiel" sie konstant unterdrückt.

28
RESEARCHDEV.to AI·4/17/2026

Logical Neural Networks

Logische Neuronale Netze sind ein Forschungsgebiet, das die Integration von symbolischem Denken mit der Mustererkennung neuronaler Netze anstrebt. Dieses Feld untersucht, wie explizite Wissensrepräsentation und logische Inferenz mit den Lernfähigkeiten konnektionistischer Modelle kombiniert werden können.

28
RESEARCHarXiv CS.CL·4/20/2026

Brain Score Tracks Shared Properties of Languages: Evidence from Many Natural Languages and Structured Sequences

Diese Forschung untersucht die Ähnlichkeit zwischen der Verarbeitung von Sprachmodellen und menschlicher Sprachverarbeitung mithilfe des Brain Score-Frameworks. Die Ergebnisse deuten darauf hin, dass LMs, die auf verschiedenen natürlichen Sprachen und sogar auf strukturierten Daten (menschliches Genom, Python) trainiert wurden, ähnliche Brain Score-Leistungen zeigen, was darauf hindeutet, dass die Metrik die Fähigkeit zur Extraktion gemeinsamer Strukturen erfasst.

28
RESEARCHarXiv CS.CL·5/4/2026

Timing is Everything: Temporal Scaffolding of Semantic Surprise in Humor

Diese Forschung schlägt den Dual Prediction Violation (DPV)-Rahmen vor, um Humor zu erklären, wobei die Wechselwirkung zwischen Inhalt und Timing betont wird. Durch die Analyse von 828 chinesischen Stand-up-Darbietungen zeigt sie, dass zeitliche Merkmale, insbesondere Spitzen semantischer Verletzungen und systematische Pausen, die Publikumsreaktion wesentlich stärker vorhersagen als alleinige semantische Inkongruenz.

28
RESEARCHarXiv CS.LG·vor 21T

A Structural Threshold in Decision Capacity Governs Collapse in Self-Play Reinforcement Learning

Diese Arbeit zeigt, dass eine Schwelle in der Entscheidungskapazität den Kollaps von Self-Play-Reinforcement-Learning-Agenten unter asymmetrischen Regelstörungen steuert. Die Eliminierung aller positive-reach kontingenten Entscheidungen führt zu einem schnellen Kollaps, während das Beibehalten einer einzigen solchen Entscheidung dies verhindert.

28
RESEARCHarXiv CS.CL·vor 5T

When Retrieval Doesn't Help: A Large-Scale Study of Biomedical RAG

Eine groß angelegte Studie evaluiert die Retrieval-Augmented Generation (RAG) im Bereich der medizinischen Fragenbeantwortung neu und findet nur geringe und inkonsistente Verbesserungen gegenüber Baselines ohne Retrieval. Sie deutet darauf hin, dass die Wahl des Backbone-Modells entscheidender ist als die Retrieval-Methoden und der Hauptengpass in der Fähigkeit des Modells liegt, abgerufene Evidenz effektiv zu nutzen.

28
RESEARCHarXiv CS.CL·vor 5T

SaliMory: Orchestrating Cognitive Memory for Conversational Agents

SALIMORY ist ein Framework, das ein einziges Sprachmodell trainiert, um kognitiv strukturierte Speicher für Konversationsagenten zu verwalten, und adressiert Probleme bestehender Methoden. Es nutzt eine hierarchische stufenweise Prozessbelohnung und kontrastive Verfeinerung, was zu erheblichen Verbesserungen bei Genauigkeit und Personalisierung führt und speicherbedingte Fehler reduziert.

28
RESEARCHarXiv CS.LG·vor 27T

Steering Without Breaking: Mechanistically Informed Interventions for Discrete Diffusion Language Models

Diese Arbeit untersucht die Einschränkungen gleichmäßiger Interventionen in diskreten Diffusions-Sprachmodellen (DLMs) und zeigt, dass diese die Qualität der gesteuerten Generierung verschlechtern. Die Autoren stellen fest, dass verschiedene Attribute zu unterschiedlichen Zeitpunkten im Denoising-Prozess fixiert werden, und schlagen einen adaptiven Planer vor, um Interventionen effizient zu konzentrieren.

28
RESEARCHarXiv CS.CL·vor 12T

From AR to Diffusion: Efficiently Adapting Large Language Models with Strictly Causal and Elastic Horizons

FLUID ist ein neues Framework, das autoregressive (AR) Backbones effizient an das Diffusionsparadigma zur parallelen Textgenerierung anpasst. Es ermöglicht die Initialisierung von GPT-Modellen und führt einen dynamischen Entrauschungsmechanismus ein, wodurch Spitzenleistungen bei erheblich reduzierten Trainingskosten erzielt werden.

28
RESEARCHarXiv CS.LG·vor 22T

TeamTR: Trust-Region Fine-Tuning for Multi-Agent LLM Coordination

Dieses Papier stellt TeamTR vor, ein Trust-Region-Framework zur Feinabstimmung von Multi-Agenten-LLM-Systemen, das strukturelle Fehler bei der sequentiellen Feinabstimmung adressiert. Es beweist, dass eine veraltete Belegungsevaluation eine quadratische Strafe mit der Anzahl der Agenten nach sich zieht und die Leistung im Durchschnitt um 7,1% verbessert.

28
RESEARCHarXiv CS.LG·vor 15T

Reading Calibrated Uncertainty from Language Model Trajectories

Diese Forschungsarbeit schlägt eine neue Methode zur Quantifizierung der Unsicherheit in Sprachmodellen vor, indem sie den kumulativen Pfad von MLP-Updates pro Schicht verfolgt. Durch die Extraktion von elf skaleninvarianten geometrischen Merkmalen übertrifft eine dünne lineare Sonde die maximale Softmax-Wahrscheinlichkeit bei der Bewertung der Unsicherheit.

28
RESEARCHarXiv CS.CL·4/20/2026

DALM: A Domain-Algebraic Language Model via Three-Phase Structured Generation

DALM (Domain-Algebraic Language Model) wird vorgeschlagen, um Wissensinterferenzen in LLMs zu beheben, indem die unbeschränkte Token-Generierung durch strukturiertes Denoising über ein Domänen-Gitter ersetzt wird. Es folgt einem dreiphasigen Generierungspfad (Domänen-, Relations-, Konzeptunsicherheit) unter algebraischen Einschränkungen, wodurch eine domänenübergreifende Kontamination strukturell verhindert wird.

27