AI Research

146 items

RESEARCHarXiv CS.LG·vor 13T

ARBITER: Reasoning Trajectory Basins and Majority Vote Failures in Test-Time Sampling

Wenn Sprachmodelle Testzeit-Sampling und Mehrheitsentscheid nutzen, konzentrieren sich Denkpfade in nicht-unabhängigen

language models Model Evaluation Reasoning AI Research

RESEARCHarXiv CS.CL·vor 12T

Bridging the Stability-Expressivity Gap: Synthetic Data Scaling and Preference Alignment for Low-Resource Spoken Language Models

Diese Forschung befasst sich mit der Stabilitäts-Expressivitäts-Lücke in gesprochenen Sprachmodellen (SLMs) für ressourcenarme Sprachen, verursacht durch die intensive Nutzung synthetischer Daten. Während synthetische Daten die phonetische Genauigkeit verbessern, beeinträchtigen sie die prosodische Ausdrucksfähigkeit, ein Phänomen, das als Synthetische Erosion bezeichnet wird. Das Papier stellt Selbstausrichtungsrahmen vor, um die Ausdrucksfähigkeit wiederherzustellen.

synthetic data speech synthesis spoken language models Low-resource languages

RESEARCHDEV.to AI·5/4/2026

Learning to Efficiently Sample from Diffusion Probabilistic Models

Diese Forschung konzentriert sich auf die Entwicklung effizienterer Methoden zur Stichprobenentnahme aus Diffusion Probabilistic Models, um den Rechenaufwand und die Zeit für die Generierung hochwertiger Stichproben zu reduzieren. Sie untersucht neuartige Algorithmen zur Beschleunigung des Stichprobenprozesses unter Beibehaltung der Datenintegrität.

Diffusion Models generative models machine learning Sampling Efficiency

ARTICLEDEV.to AI·vor 26T

The Man Who Summoned Ghosts | Chapter 5: Summoning Ghosts

Dieser Inhalt befasst sich mit Andrej Karpathys Analogie

LLMs Andrej Karpathy AI philosophy AI metaphors

ARTICLEDEV.to AI·4/25/2026

Tian AI Self-Evolution: Code Modification Engine

Tian AI verfügt über eine Selbstentwicklungs-Engine, die ihren eigenen Python-Code basierend auf Betriebserfahrung analysiert und modifiziert. Dieses innovative System strebt danach, den „Heiligen Gral“ der KI-Forschung zu erreichen, indem es der KI ermöglicht, sich kontinuierlich selbst zu verbessern.

Self-evolving AI machine learning AI Systems code modification

RESEARCHDEV.to AI·4/11/2026

Learning Neural Causal Models from Unknown Interventions

Diese Arbeit erforscht Methoden für neuronale Modelle, um Ursache-Wirkungs-Beziehungen zu lernen, selbst wenn datengenerierende Interventionen unbekannt sind. Ziel der Forschung ist es, die Fähigkeit künstlicher Intelligenz zur Ableitung von Kausalität aus komplexen Daten zu verbessern.

neural networks machine learning causality causal inference

RESEARCHarXiv CS.CL·4/6/2026

Single-Agent LLMs Outperform Multi-Agent Systems on Multi-Hop Reasoning Under Equal Thinking Token Budgets

Este estudo argumenta, com base na Desigualdade de Processamento de Dados, que LLMs de agente único são mais eficientes em termos de informação do que sistemas multiagente sob orçamentos de token de raciocínio iguais. A pesquisa testa empiricamente esta previsão, que sugere que sistemas multiagente se tornam competitivos quando a utilização de contexto de um único agente é degradada ou mais poder computacional é despendido.

LLMs Information Efficiency Computational Budget Multi-Hop Reasoning

RESEARCHarXiv CS.LG·5/6/2026

Generate, Filter, Control, Replay: A Comprehensive Survey of Rollout Strategies for LLM Reinforcement Learning

Diese Übersicht bietet eine optimierer-agnostische Sicht auf Rollout-Strategien für das RL-basierte Nachtraining von Reasoning-LLMs. Sie formalisiert Rollout-Pipelines mit einer einheitlichen Notation und führt die Generate-Filter-Control-Replay (GFCR) Lebenszyklus-Taxonomie ein, die Pipelines in vier modulare Phasen zerlegt.

Rollout Strategies reinforcement learning machine learning AI Research

CASEOpenAI Blog·vor 29T

How NVIDIA engineers and researchers build with Codex

Ingenieure und Forscher von NVIDIA nutzen Codex mit GPT-5.5, um Produktionssysteme zu entwickeln. Sie verwenden diese Tools auch, um Forschungsideen in ausführbare Experimente umzuwandeln.

Codex GPT-5.5 NVIDIA AI development

RESEARCHarXiv CS.CL·4/7/2026

Evolutionary Search for Automated Design of Uncertainty Quantification Methods

Este artigo explora o uso de busca evolucionária impulsionada por LLMs para desenvolver automaticamente métodos de Quantificação de Incerteza (UQ) não supervisionados. Os métodos evoluídos superam baselines manuais em verificação de alegações, demonstrando generalização robusta e estratégias distintas entre diferentes modelos de LLM.

LLMs Uncertainty Quantification Evolutionary Search AI Research

RESEARCHarXiv CS.CL·vor 28T

jina-embeddings-v5-omni: Geometry-preserving Embeddings via Locked Aligned Towers

Diese Arbeit stellt GELATO vor, einen neuartigen Ansatz für multimodale Embedding-Modelle, der VLM-Architekturen erweitert. Dies führt zur jina-embeddings-v5-omni-Suite, die Text, Bilder, Audio und Video effizient in einen einzigen semantischen Embedding-Raum kodiert, indem Basis-Textmodelle eingefroren und nur Verbindungskomponenten trainiert werden.

embedding models multimodal AI deep learning machine learning

RESEARCHarXiv CS.AI·vor 19T

OSCToM: RL-Guided Adversarial Generation for High-Order Theory of Mind

Dieses Papier stellt OSCToM vor, einen Ansatz zur Modellierung verschachtelter Glaubenskonflikte in LLM-basierten Theory of Mind-Aufgaben. Es kombiniert Reinforcement Learning und Kompositions-Surrogatmodelle, um diese Konflikte zu generieren, wobei OSCToM-8B in Experimenten die besten Ergebnisse erzielte.

LLMs reinforcement learning AI Research Theory of Mind

RESEARCHarXiv CS.AI·vor 19T

High Quality Embeddings for Horn Logic Reasoning

Dieser Artikel stellt neue Ansätze zur Erstellung hochwertiger Embeddings für logische Aussagen vor, die für das Training neuronaler Netze zur effizienten Bewertung von Entscheidungen logischer Schlussfolgerer entscheidend sind. Diese Methoden umfassen die Generierung von Ankern mit wiederholten Begriffen, die Ausbalancierung einfacher, mittlerer und schwerer Beispiele für das Triplet-Loss-Training sowie die periodische Betonung der schwierigsten Beispiele.

neural networks Logic reasoning machine learning embeddings

RESEARCHarXiv CS.AI·vor 21T

Scalable Uncertainty Reasoning in Knowledge Graphs

Diese Forschung schlägt ein modulares Framework vor, um skalierbare Unsicherheitsresonanz in Wissensgraphen zu adressieren, da reale Daten oft inhärent unsicher sind. Es behandelt drei Unsicherheitsstufen – unpräzise Attributwerte, probabilistische Tripel-Existenz und unvollständiges Schemawissen – durch maßgeschneiderte Techniken wie probabilistische Literale, probabilistische Schaltkreise und geometrische Embeddings.

Uncertainty Reasoning Knowledge Graphs Probabilistic Models Semantic Web

RESEARCHarXiv CS.AI·vor 19T

AgentCo-op: Retrieval-Based Synthesis of Interoperable Multi-Agent Workflows

AgentCo-op ist ein abrufbasierter Synthese-Framework, der interoperable Multi-Agenten-Workflows aus wiederverwendbaren Fähigkeiten, Werkzeugen und externen Agenten zusammensetzt. Es wendet eine begrenzte, selbstgeführte lokale Reparatur auf beteiligte Komponenten bei Ausführungsfehlern an und wurde in Genomik-Fallstudien zur Koordination spezialisierter Agenten demonstriert.

workflow automation Genomics Scientific Discovery multi-agent systems

ARTICLEHugging Face (YouTube)·vor 19T

On the slow death of Scaling (birth of Adaption Labs) | Sara Hooker | HF ML Club India EP2

Dieser Inhalt behandelt die Entwicklung von KI-Methodologien, diskutiert den Rückgang traditioneller Skalierungsansätze und das Aufkommen neuer Strategien, veranschaulicht durch die Gründung von Adaption Labs. Präsentiert von Sara Hooker, beleuchtet die Episode des HF ML Club India bedeutende Veränderungen im Bereich der künstlichen Intelligenz.

Adaption Labs machine learning scaling AI Research

On the slow death of Scaling (birth of Adaption Labs) | Sara Hooker | HF ML Club India EP2

NEWSLangChain Blog·vor 21T

Introducing LangChain Labs

LangChain Labs ist eine neue angewandte Forschungsinitiative, die sich auf kontinuierliches Lernen für Agenten konzentriert. Sie fördert mit Partnern offene Forschung an selbstverbessernden KI-Systemen.

LangChain self-improving AI AI Research AI agents

ARTICLEDEV.to AI·4/13/2026

I Ran 500 More Agent Memory Experiments. The Real Problem Wasn’t Recall. It Was Binding.

Dieser Artikel beschreibt die Ergebnisse von 500 Experimenten mit der Gedächtnisleistung von KI-Agenten und weist darauf hin, dass das Hauptproblem nicht der Abruf, sondern das Bindungsproblem ist. Die Forschung legt nahe, dass die Verbesserung der Art und Weise, wie KI-Agenten disparate Informationen miteinander verbinden, entscheidend für die Weiterentwicklung ihrer kognitiven Fähigkeiten ist.

Memory Systems cognitive architectures Binding problem AI Research

RESEARCHHugging Face (YouTube)·4/27/2026

Multi-Agent AutoResearch with Open Source Models

Dieser Inhalt untersucht das Konzept der Multi-Agenten-AutoResearch und beschreibt, wie mehrere KI-Agenten bei der Durchführung von Forschungsaufgaben zusammenarbeiten können. Er konzentriert sich insbesondere auf die Nutzung von Open-Source-Modellen, um diese automatisierten Forschungsprozesse zu erleichtern und zu verbessern.

open source models multi-agent systems automation AI Research

Multi-Agent AutoResearch with Open Source Models

RESEARCHHugging Face (YouTube)·4/16/2026

Hugging Face Journal Club: Embarrassingly Simple Self-Distillation Improves Code Generation

Dieser Inhalt des Hugging Face Journal Clubs erörtert eine "beschämend einfache" Methode der Selbst-Destillation, die die Codegenerierung erheblich verbessert. Er beleuchtet Fortschritte bei der Nutzung großer Sprachmodelle für Programmieraufgaben.

machine learning code generation Self-Distillation large language models

Hugging Face Journal Club: Embarrassingly Simple Self-Distillation Improves Code Generation