AI Research

146 items

RESEARCHarXiv CS.CL·vor 7T

SENSE: Semantic Embedding Navigation with Soft-gated Evaluation for Retrieval-based Speculative Decoding

Dieses Papier schlägt SENSE (Semantic Embedding Navigation with Soft-gated Evaluation) vor, um Retrieval-basierte Spekulative Dekodierung (RSD) für LLMs zu verbessern. SENSE adressiert die starren lexikalischen Abhängigkeiten von RSD, indem es robuste semantische Ausrichtung und ein Soft-gated Evaluationsmodul verwendet, um semantische Äquivalenz zu validieren.

LLMs NLP Inference Optimization Speculative Decoding

RESEARCHarXiv CS.LG·vor 13T

GEM: Geometric Entropy Mixing for Optimal LLM Data Curation

Dieses Papier stellt GEM (Geometric Entropy Mixing) vor, ein neuartiges Framework für die LLM-Datenkuratierung, das das Problem als Variationsproblem auf der Hypersphäre neu formuliert. GEM optimiert die Datenzusammensetzung für das LLM-Vortraining, überwindet Kategorisierungsfehler und entdeckt ausgewogene semantische Strukturen.

machine learning Geometric Entropy Mixing data curation AI Research

ARTICLE↑ trendingReddit r/MachineLearning·4/16/2026

Camera-ready paranoia [D]

Nach der Einreichung ihres Papiers bei CVPRW verspürt ein Benutzer eine „camera-ready Paranoia“ und befürchtet trotz der Verwendung eines PDF-Validierungstools und der korrekten Vorlage eine Ablehnung aufgrund möglicher Fehler. Sie suchen Bestätigung, wann das Papier in die Tagungsband aufgenommen wird, und weisen auf den aktuellen Status „In Produktion“ hin.

academic submission research publishing computer vision AI Research

RESEARCHarXiv CS.CL·4/6/2026

PolyJarvis: LLM Agent for Autonomous Polymer MD Simulations

PolyJarvis é um agente LLM que automatiza simulações de dinâmica molecular de polímeros para prever propriedades a partir de linguagem natural, utilizando a plataforma RadonPy. O sistema executa tarefas desde a construção do monômero até o cálculo de propriedades, mostrando previsões precisas de densidade e módulos de elasticidade para polímeros como aPS e PMMA.

Autonomous Simulation LLM Agent Molecular Dynamics Polymer Science

RESEARCHDEV.to AI·vor 18T

Hugging Face: New Research Highlights Value of Specialized AI Models

Hugging Face veröffentlichte am 22. Mai 2026 eine Studie von Dharma AI, die zeigt, dass spezialisierte KI-Modelle größere, allgemeine Modelle bei bestimmten Aufgaben übertreffen können. Die Studie schlägt eine strategische Verschiebung in der KI-Beschaffung vor, die aufgabenspezifische Leistung und Effizienz betont.

specialized AI models Hugging Face AI procurement large language models

RESEARCHarXiv CS.CL·vor 5T

Discourse-Role Labels as Presentation-Time Variables for Context Use in Language Models

Diese Studie untersucht den Einfluss von Diskursrollen-Etiketten wie "Referenz" oder "Anweisung" auf das Verhalten von Sprachmodellen. Es zeigt sich, dass sich die Adoptionsrate irreführender Informationen je nach Etikett erheblich verschieben kann (56-84 Prozentpunkte), wobei Etiketten wie "Anweisung" die Adoption erhöhen und "Beispiel" sie konstant unterdrückt.

language models Context NLP model behavior

RESEARCHDEV.to AI·4/17/2026

Logical Neural Networks

Logische Neuronale Netze sind ein Forschungsgebiet, das die Integration von symbolischem Denken mit der Mustererkennung neuronaler Netze anstrebt. Dieses Feld untersucht, wie explizite Wissensrepräsentation und logische Inferenz mit den Lernfähigkeiten konnektionistischer Modelle kombiniert werden können.

neural networks machine learning logic AI Research

RESEARCHarXiv CS.CL·4/20/2026

Brain Score Tracks Shared Properties of Languages: Evidence from Many Natural Languages and Structured Sequences

Diese Forschung untersucht die Ähnlichkeit zwischen der Verarbeitung von Sprachmodellen und menschlicher Sprachverarbeitung mithilfe des Brain Score-Frameworks. Die Ergebnisse deuten darauf hin, dass LMs, die auf verschiedenen natürlichen Sprachen und sogar auf strukturierten Daten (menschliches Genom, Python) trainiert wurden, ähnliche Brain Score-Leistungen zeigen, was darauf hindeutet, dass die Metrik die Fähigkeit zur Extraktion gemeinsamer Strukturen erfasst.

language models fMRI Neuroscience AI Research

RESEARCHarXiv CS.CL·5/4/2026

Timing is Everything: Temporal Scaffolding of Semantic Surprise in Humor

Diese Forschung schlägt den Dual Prediction Violation (DPV)-Rahmen vor, um Humor zu erklären, wobei die Wechselwirkung zwischen Inhalt und Timing betont wird. Durch die Analyse von 828 chinesischen Stand-up-Darbietungen zeigt sie, dass zeitliche Merkmale, insbesondere Spitzen semantischer Verletzungen und systematische Pausen, die Publikumsreaktion wesentlich stärker vorhersagen als alleinige semantische Inkongruenz.

cognitive science humor stand-up comedy AI Research

RESEARCHarXiv CS.LG·vor 21T

A Structural Threshold in Decision Capacity Governs Collapse in Self-Play Reinforcement Learning

Diese Arbeit zeigt, dass eine Schwelle in der Entscheidungskapazität den Kollaps von Self-Play-Reinforcement-Learning-Agenten unter asymmetrischen Regelstörungen steuert. Die Eliminierung aller positive-reach kontingenten Entscheidungen führt zu einem schnellen Kollaps, während das Beibehalten einer einzigen solchen Entscheidung dies verhindert.

Decision Making reinforcement learning learning game theory

RESEARCHarXiv CS.CL·vor 5T

When Retrieval Doesn't Help: A Large-Scale Study of Biomedical RAG

Eine groß angelegte Studie evaluiert die Retrieval-Augmented Generation (RAG) im Bereich der medizinischen Fragenbeantwortung neu und findet nur geringe und inkonsistente Verbesserungen gegenüber Baselines ohne Retrieval. Sie deutet darauf hin, dass die Wahl des Backbone-Modells entscheidender ist als die Retrieval-Methoden und der Hauptengpass in der Fähigkeit des Modells liegt, abgerufene Evidenz effektiv zu nutzen.

RAG Medical Question Answering Biomedical AI large language models

RESEARCHarXiv CS.CL·vor 5T

SaliMory: Orchestrating Cognitive Memory for Conversational Agents

SALIMORY ist ein Framework, das ein einziges Sprachmodell trainiert, um kognitiv strukturierte Speicher für Konversationsagenten zu verwalten, und adressiert Probleme bestehender Methoden. Es nutzt eine hierarchische stufenweise Prozessbelohnung und kontrastive Verfeinerung, was zu erheblichen Verbesserungen bei Genauigkeit und Personalisierung führt und speicherbedingte Fehler reduziert.

language models memory management AI Research Conversational AI

RESEARCHarXiv CS.CL·vor 19T

Long-Context Reasoning Through Proxy-Based Chain-of-Thought Tuning

Große Sprachmodelle zeigen trotz Unterstützung umfangreicher Eingaben schlechte Leistungen bei komplexen Langkontext-Argumentationsaufgaben. ProxyCoT ist ein neuer Trainingsansatz, der Argumentationsfähigkeiten von kurzen Proxy-Kontexten auf vollständige lange Kontexte überträgt und starke Baselines übertrifft.

machine learning Natural Language Processing Reasoning large language models

RESEARCHarXiv CS.CL·vor 27T

Instructions shape Production of Language, not Processing

Diese Forschungsarbeit untersucht einen produktionszentrierten Mechanismus in Sprachmodellen und offenbart eine Asymmetrie zwischen Sprachverarbeitung und -produktion. Sie zeigt, dass Anweisungen die Informationen in Ausgabetoken, aber nicht in Eingabetoken, erheblich formen und stark mit dem Modellverhalten korrelieren.

language models cognitive science NLP AI Research

RESEARCHarXiv CS.LG·vor 27T

Steering Without Breaking: Mechanistically Informed Interventions for Discrete Diffusion Language Models

Diese Arbeit untersucht die Einschränkungen gleichmäßiger Interventionen in diskreten Diffusions-Sprachmodellen (DLMs) und zeigt, dass diese die Qualität der gesteuerten Generierung verschlechtern. Die Autoren stellen fest, dass verschiedene Attribute zu unterschiedlichen Zeitpunkten im Denoising-Prozess fixiert werden, und schlagen einen adaptiven Planer vor, um Interventionen effizient zu konzentrieren.

Diffusion Models language models Controlled Generation text generation

RESEARCHarXiv CS.CL·vor 12T

From AR to Diffusion: Efficiently Adapting Large Language Models with Strictly Causal and Elastic Horizons

FLUID ist ein neues Framework, das autoregressive (AR) Backbones effizient an das Diffusionsparadigma zur parallelen Textgenerierung anpasst. Es ermöglicht die Initialisierung von GPT-Modellen und führt einen dynamischen Entrauschungsmechanismus ein, wodurch Spitzenleistungen bei erheblich reduzierten Trainingskosten erzielt werden.

Diffusion Models text generation large language models Autoregressive Models

RESEARCHarXiv CS.LG·vor 22T

TeamTR: Trust-Region Fine-Tuning for Multi-Agent LLM Coordination

Dieses Papier stellt TeamTR vor, ein Trust-Region-Framework zur Feinabstimmung von Multi-Agenten-LLM-Systemen, das strukturelle Fehler bei der sequentiellen Feinabstimmung adressiert. Es beweist, dass eine veraltete Belegungsevaluation eine quadratische Strafe mit der Anzahl der Agenten nach sich zieht und die Leistung im Durchschnitt um 7,1% verbessert.

Multi-agent LLMs LLM coordination Trust-region method Fine-tuning

RESEARCHarXiv CS.LG·vor 15T

Reading Calibrated Uncertainty from Language Model Trajectories

Diese Forschungsarbeit schlägt eine neue Methode zur Quantifizierung der Unsicherheit in Sprachmodellen vor, indem sie den kumulativen Pfad von MLP-Updates pro Schicht verfolgt. Durch die Extraktion von elf skaleninvarianten geometrischen Merkmalen übertrifft eine dünne lineare Sonde die maximale Softmax-Wahrscheinlichkeit bei der Bewertung der Unsicherheit.

language models deep learning Uncertainty Quantification model calibration

RESEARCHarXiv CS.CL·vor 15T

RAS: Reflection-Augmented Scaling with In-Context Learning for Executable Cypher Query Generation

Die Studie stellt Reflection-Augmented Scaling (RAS) für die Generierung ausführbarer Cypher-Abfragen vor, das Ausführungsfeedback durch In-Context Learning nutzt. RAS reduziert die Fehlerquote bei der Abfrageausführung um 41-50 % und übertrifft unabhängige Skalierungsmethoden.

language models graph databases query generation in-context learning

RESEARCHarXiv CS.CL·4/20/2026

DALM: A Domain-Algebraic Language Model via Three-Phase Structured Generation

DALM (Domain-Algebraic Language Model) wird vorgeschlagen, um Wissensinterferenzen in LLMs zu beheben, indem die unbeschränkte Token-Generierung durch strukturiertes Denoising über ein Domänen-Gitter ersetzt wird. Es folgt einem dreiphasigen Generierungspfad (Domänen-, Relations-, Konzeptunsicherheit) unter algebraischen Einschränkungen, wodurch eine domänenübergreifende Kontamination strukturell verhindert wird.

language models machine learning Natural Language Processing AI Research