← heapsort-ai

AI Research

146 items

RESEARCHarXiv CS.CL·vor 12T

Bridging the Stability-Expressivity Gap: Synthetic Data Scaling and Preference Alignment for Low-Resource Spoken Language Models

Diese Forschung befasst sich mit der Stabilitäts-Expressivitäts-Lücke in gesprochenen Sprachmodellen (SLMs) für ressourcenarme Sprachen, verursacht durch die intensive Nutzung synthetischer Daten. Während synthetische Daten die phonetische Genauigkeit verbessern, beeinträchtigen sie die prosodische Ausdrucksfähigkeit, ein Phänomen, das als Synthetische Erosion bezeichnet wird. Das Papier stellt Selbstausrichtungsrahmen vor, um die Ausdrucksfähigkeit wiederherzustellen.

27
RESEARCHDEV.to AI·5/4/2026

Learning to Efficiently Sample from Diffusion Probabilistic Models

Diese Forschung konzentriert sich auf die Entwicklung effizienterer Methoden zur Stichprobenentnahme aus Diffusion Probabilistic Models, um den Rechenaufwand und die Zeit für die Generierung hochwertiger Stichproben zu reduzieren. Sie untersucht neuartige Algorithmen zur Beschleunigung des Stichprobenprozesses unter Beibehaltung der Datenintegrität.

27
RESEARCHarXiv CS.CL·4/6/2026

Single-Agent LLMs Outperform Multi-Agent Systems on Multi-Hop Reasoning Under Equal Thinking Token Budgets

Este estudo argumenta, com base na Desigualdade de Processamento de Dados, que LLMs de agente único são mais eficientes em termos de informação do que sistemas multiagente sob orçamentos de token de raciocínio iguais. A pesquisa testa empiricamente esta previsão, que sugere que sistemas multiagente se tornam competitivos quando a utilização de contexto de um único agente é degradada ou mais poder computacional é despendido.

27
RESEARCHarXiv CS.LG·5/6/2026

Generate, Filter, Control, Replay: A Comprehensive Survey of Rollout Strategies for LLM Reinforcement Learning

Diese Übersicht bietet eine optimierer-agnostische Sicht auf Rollout-Strategien für das RL-basierte Nachtraining von Reasoning-LLMs. Sie formalisiert Rollout-Pipelines mit einer einheitlichen Notation und führt die Generate-Filter-Control-Replay (GFCR) Lebenszyklus-Taxonomie ein, die Pipelines in vier modulare Phasen zerlegt.

27
RESEARCHarXiv CS.CL·4/7/2026

Evolutionary Search for Automated Design of Uncertainty Quantification Methods

Este artigo explora o uso de busca evolucionária impulsionada por LLMs para desenvolver automaticamente métodos de Quantificação de Incerteza (UQ) não supervisionados. Os métodos evoluídos superam baselines manuais em verificação de alegações, demonstrando generalização robusta e estratégias distintas entre diferentes modelos de LLM.

27
RESEARCHarXiv CS.CL·vor 28T

jina-embeddings-v5-omni: Geometry-preserving Embeddings via Locked Aligned Towers

Diese Arbeit stellt GELATO vor, einen neuartigen Ansatz für multimodale Embedding-Modelle, der VLM-Architekturen erweitert. Dies führt zur jina-embeddings-v5-omni-Suite, die Text, Bilder, Audio und Video effizient in einen einzigen semantischen Embedding-Raum kodiert, indem Basis-Textmodelle eingefroren und nur Verbindungskomponenten trainiert werden.

27
RESEARCHarXiv CS.AI·vor 19T

High Quality Embeddings for Horn Logic Reasoning

Dieser Artikel stellt neue Ansätze zur Erstellung hochwertiger Embeddings für logische Aussagen vor, die für das Training neuronaler Netze zur effizienten Bewertung von Entscheidungen logischer Schlussfolgerer entscheidend sind. Diese Methoden umfassen die Generierung von Ankern mit wiederholten Begriffen, die Ausbalancierung einfacher, mittlerer und schwerer Beispiele für das Triplet-Loss-Training sowie die periodische Betonung der schwierigsten Beispiele.

27
RESEARCHarXiv CS.AI·vor 21T

Scalable Uncertainty Reasoning in Knowledge Graphs

Diese Forschung schlägt ein modulares Framework vor, um skalierbare Unsicherheitsresonanz in Wissensgraphen zu adressieren, da reale Daten oft inhärent unsicher sind. Es behandelt drei Unsicherheitsstufen – unpräzise Attributwerte, probabilistische Tripel-Existenz und unvollständiges Schemawissen – durch maßgeschneiderte Techniken wie probabilistische Literale, probabilistische Schaltkreise und geometrische Embeddings.

27
RESEARCHarXiv CS.AI·vor 19T

AgentCo-op: Retrieval-Based Synthesis of Interoperable Multi-Agent Workflows

AgentCo-op ist ein abrufbasierter Synthese-Framework, der interoperable Multi-Agenten-Workflows aus wiederverwendbaren Fähigkeiten, Werkzeugen und externen Agenten zusammensetzt. Es wendet eine begrenzte, selbstgeführte lokale Reparatur auf beteiligte Komponenten bei Ausführungsfehlern an und wurde in Genomik-Fallstudien zur Koordination spezialisierter Agenten demonstriert.

27
ARTICLEHugging Face (YouTube)·vor 19T

On the slow death of Scaling (birth of Adaption Labs) | Sara Hooker | HF ML Club India EP2

Dieser Inhalt behandelt die Entwicklung von KI-Methodologien, diskutiert den Rückgang traditioneller Skalierungsansätze und das Aufkommen neuer Strategien, veranschaulicht durch die Gründung von Adaption Labs. Präsentiert von Sara Hooker, beleuchtet die Episode des HF ML Club India bedeutende Veränderungen im Bereich der künstlichen Intelligenz.

On the slow death of Scaling (birth of Adaption Labs) | Sara Hooker | HF ML Club India EP2
27
ARTICLEDEV.to AI·4/13/2026

I Ran 500 More Agent Memory Experiments. The Real Problem Wasn’t Recall. It Was Binding.

Dieser Artikel beschreibt die Ergebnisse von 500 Experimenten mit der Gedächtnisleistung von KI-Agenten und weist darauf hin, dass das Hauptproblem nicht der Abruf, sondern das Bindungsproblem ist. Die Forschung legt nahe, dass die Verbesserung der Art und Weise, wie KI-Agenten disparate Informationen miteinander verbinden, entscheidend für die Weiterentwicklung ihrer kognitiven Fähigkeiten ist.

27