← heapsort-ai

Retrieval Augmented Generation

13 items

RESEARCHarXiv CS.CL·vor 20Std

Retrieval Augmented Generation Framework for the Nepali Legal Domain Question Answering

Diese Studie stellt die erste Anwendung eines Retrieval Augmented Generation (RAG)-Modells für die Beantwortung juristischer Fragen in Nepali vor und adressiert die Datenknappheit in ressourcenarmen Sprachen. Durch die Verwendung von BM25 auf segmentierten Dokumenten erreichte die RAG-Pipeline eine hohe Präzision und Wahrheitsgenauigkeit, was ihre Wirksamkeit im nepalesischen Rechtsbereich demonstriert.

54
RESEARCHarXiv CS.AI·4/15/2026

Memory as Metabolism: A Design for Companion Knowledge Systems

Diese Arbeit schlägt ein begleiter-spezifisches Governance-Profil für Einzelnutzer-Wissenswikis vor, das den einzigartigen Fehlermodus der Verfestigung unter nutzergekoppeltem Drift adressiert. Sie diskutiert ab 2026 aufkommende persönliche KI-Speicherarchitekturen, darunter RAG-basierte Systeme und Wiki-ähnliche Designs, sowie etablierte akademische und Produktions-Speichersysteme.

28
RESEARCHarXiv CS.CL·4/6/2026

Principled and Scalable Diversity-Aware Retrieval via Cardinality-Constrained Binary Quadratic Programming

Este trabalho propõe uma formulação rigorosa para a recuperação consciente da diversidade em Geração Aumentada por Recuperação (RAG), abordando a falta de garantias teóricas e escalabilidade dos métodos existentes. A solução utiliza programação quadrática binária com restrição de cardinalidade (CCBQP) e um algoritmo baseado em Frank-Wolfe, demonstrando desempenho superior na fronteira de Pareto de relevância-diversidade e maior velocidade.

28
RESEARCHarXiv CS.AI·5/1/2026

Think it, Run it: Autonomous ML pipeline generation via self-healing multi-agent AI

Dieses Papier stellt eine einheitliche Multi-Agenten-KI-Architektur vor, die die End-to-End-Generierung von Machine-Learning (ML)-Pipelines aus Datensätzen und natürlichsprachlichen Zielen automatisiert. Das Fünf-Agenten-System integriert RAG, einen erklärbaren hybriden Recommender und einen selbstheilenden Mechanismus basierend auf LLM, wodurch eine Erfolgsquote von 84,7% und verbesserte Robustheit erzielt werden.

27
DOCDEV.to AI·4/27/2026

From Static Data to Conversational AI: Building a RAG-Powered Customer Agent (Part 2)

Teil 2 dieser Reihe konzentriert sich auf den Aufbau der Schnittstelle und des Reasoning Engine für einen RAG-gestützten Kundenagenten. Es wird detailliert beschrieben, wie ein Messaging-Front-End (Telegram Bot API) mit einer Vektordatenbank (Pinecone) und einem LLM mittels Make.com verbunden wird, um präzise Echtzeit-Antworten zu liefern.

27
RESEARCHarXiv CS.CL·4/15/2026

Benchmarking Deflection and Hallucination in Large Vision-Language Models

Diese Arbeit stellt VLM-DeflectionBench vor, einen neuen Benchmark für große Vision-Sprachmodelle (LVLMs), der sich auf Ablenkung und Halluzination konzentriert, wenn mit widersprüchlichen oder unzureichenden Beweisen umgegangen wird. Sie schlägt außerdem eine dynamische Datenkuratierungspipeline vor, um die Schwierigkeit des Benchmarks im Laufe der Zeit aufrechtzuerhalten, sowie ein feingranulares Evaluierungsprotokoll, um das Modellverhalten zu entflechten.

27
RESEARCHarXiv CS.CL·4/30/2026

CogRAG+: Cognitive-Level Guided Diagnosis and Remediation of Memory and Reasoning Deficiencies in Professional Exam QA

CogRAG+ ist ein trainingsfreies Framework zur Diagnose und Behebung von Gedächtnis- und Denkdefiziten in großen Sprachmodellen bei professionellen Prüfungsfragen. Es entkoppelt und richtet Abruf und Schlussfolgerung an menschlichen kognitiven Hierarchien aus, indem es Reinforced Retrieval und kognitionsgeschichtetes Constrained Reasoning einsetzt, um Genauigkeit und Konsistenz zu verbessern.

27
RESEARCHarXiv CS.CL·5/8/2026

AdaGATE: Adaptive Gap-Aware Token-Efficient Evidence Assembly for Multi-Hop Retrieval-Augmented Generation

AdaGATE ist ein trainingsfreier Evidenz-Controller für Multi-Hop Retrieval-Augmented Generation (RAG), der entwickelt wurde, um verrauschte oder redundante abgerufene Evidenz in begrenzten Kontexten zu adressieren. Es fasst die Evidenzauswahl als token-beschränktes Reparaturproblem auf und kombiniert lückenorientiertes Tracking und zielgerichtete Mikro-Anfragen, um Abdeckung, Bestätigung und Neuheit auszugleichen.

27
RESEARCHarXiv CS.CL·vor 8T

CanLegalRAGBench: Evaluating Retrieval-Augmented Generation on Canadian Case Law

Diese Arbeit stellt CanLegalRAGBench vor, einen neuen kanadischen Rechts-QA-Benchmark zur Bewertung von Retrieval-Augmented Generation (RAG)-Systemen mit realistischen Anfragen und von Experten annotierten Fallrecht-Antworten. Sie zeigt die Sensibilität der Retrieval-Leistung, die Wettbewerbsfähigkeit von Open-Source-Embedding-Modellen sowie die Grenzen automatischer Bewertungen und LLM-Halluzinationen in generierten Antworten auf.

27
RESEARCHarXiv CS.CL·4/30/2026

Generative AI-Based Virtual Assistant using Retrieval-Augmented Generation: An evaluation study for bachelor projects

Diese Arbeit evaluiert einen auf generativer KI basierenden virtuellen Assistenten, der Retrieval-Augmented Generation (RAG) einsetzt, um Studenten der Universität Maastricht bei Projektvorschriften zu unterstützen. Das System zielt darauf ab, Herausforderungen wie Halluzinationen zu begegnen und genaue, kontextspezifische Antworten durch die Integration von domänenspezifischem Wissen zu liefern.

27