Retrieval Augmented Generation

13 items

RESEARCHarXiv CS.CL·vor 20Std

Retrieval Augmented Generation Framework for the Nepali Legal Domain Question Answering

Diese Studie stellt die erste Anwendung eines Retrieval Augmented Generation (RAG)-Modells für die Beantwortung juristischer Fragen in Nepali vor und adressiert die Datenknappheit in ressourcenarmen Sprachen. Durch die Verwendung von BM25 auf segmentierten Dokumenten erreichte die RAG-Pipeline eine hohe Präzision und Wahrheitsgenauigkeit, was ihre Wirksamkeit im nepalesischen Rechtsbereich demonstriert.

Retrieval Augmented Generation Legal AI Question Answering natural language processing

RESEARCHarXiv CS.CL·4/23/2026

Cognis: Context-Aware Memory for Conversational AI Agents

Lyzr Cognis stellt eine einheitliche Speicherarchitektur für konversationelle KI-Agenten vor, die den Mangel an persistentem Speicher durch eine mehrstufige Abruf-Pipeline behebt. Es kombiniert ein Dual-Store-Backend, kontextsensitiven Ingest und temporales Boosting und erreicht Spitzenleistungen bei zwei unabhängigen Benchmarks.

Retrieval Augmented Generation research memory Conversational AI

RESEARCHarXiv CS.AI·4/15/2026

Memory as Metabolism: A Design for Companion Knowledge Systems

Diese Arbeit schlägt ein begleiter-spezifisches Governance-Profil für Einzelnutzer-Wissenswikis vor, das den einzigartigen Fehlermodus der Verfestigung unter nutzergekoppeltem Drift adressiert. Sie diskutiert ab 2026 aufkommende persönliche KI-Speicherarchitekturen, darunter RAG-basierte Systeme und Wiki-ähnliche Designs, sowie etablierte akademische und Produktions-Speichersysteme.

Retrieval Augmented Generation LLMs Companion AI knowledge systems

ARTICLEDEV.to AI·vor 25T

Why your local LLM knowledge base gives bad answers (and how to fix it)

Lokale LLMs liefern oft schlechte Antworten aus persönlichen Wissensdatenbanken, was nicht am Modell selbst, sondern an Problemen in der Abrufebene liegt. Dieser Artikel untersucht das frustrierende Problem und die Funktionsweise der Abruf-Pipeline.

Retrieval Augmented Generation knowledge base Local AI LLM

RESEARCHarXiv CS.CL·4/6/2026

Principled and Scalable Diversity-Aware Retrieval via Cardinality-Constrained Binary Quadratic Programming

Este trabalho propõe uma formulação rigorosa para a recuperação consciente da diversidade em Geração Aumentada por Recuperação (RAG), abordando a falta de garantias teóricas e escalabilidade dos métodos existentes. A solução utiliza programação quadrática binária com restrição de cardinalidade (CCBQP) e um algoritmo baseado em Frank-Wolfe, demonstrando desempenho superior na fronteira de Pareto de relevância-diversidade e maior velocidade.

Retrieval Augmented Generation Scalability Diversity-aware Retrieval Binary Quadratic Programming

RESEARCHarXiv CS.AI·5/1/2026

Think it, Run it: Autonomous ML pipeline generation via self-healing multi-agent AI

Dieses Papier stellt eine einheitliche Multi-Agenten-KI-Architektur vor, die die End-to-End-Generierung von Machine-Learning (ML)-Pipelines aus Datensätzen und natürlichsprachlichen Zielen automatisiert. Das Fünf-Agenten-System integriert RAG, einen erklärbaren hybriden Recommender und einen selbstheilenden Mechanismus basierend auf LLM, wodurch eine Erfolgsquote von 84,7% und verbesserte Robustheit erzielt werden.

Retrieval Augmented Generation multi-agent AI large language models ML Automation

DOCDEV.to AI·4/27/2026

From Static Data to Conversational AI: Building a RAG-Powered Customer Agent (Part 2)

Teil 2 dieser Reihe konzentriert sich auf den Aufbau der Schnittstelle und des Reasoning Engine für einen RAG-gestützten Kundenagenten. Es wird detailliert beschrieben, wie ein Messaging-Front-End (Telegram Bot API) mit einer Vektordatenbank (Pinecone) und einem LLM mittels Make.com verbunden wird, um präzise Echtzeit-Antworten zu liefern.

Retrieval Augmented Generation LLMs Vector Databases customer service AI

DOCDEV.to AI·5/1/2026

Prompt engineering techniques

Dieses Dokument beschreibt eine Prompt-Engineering-Technik, die die Antwortqualität von KI-Modellen verbessert, indem statische Beispiele durch semantisch ähnliche Beispiele aus einer Vektordatenbank ersetzt werden. Dies beinhaltet das Indizieren erfolgreicher Konversationen und das Einfügen der relevantesten Beispiele in den System-Prompt für komplexe Aufgaben.

Retrieval Augmented Generation AI models prompt engineering Vector Databases

RESEARCHarXiv CS.CL·4/15/2026

Benchmarking Deflection and Hallucination in Large Vision-Language Models

Diese Arbeit stellt VLM-DeflectionBench vor, einen neuen Benchmark für große Vision-Sprachmodelle (LVLMs), der sich auf Ablenkung und Halluzination konzentriert, wenn mit widersprüchlichen oder unzureichenden Beweisen umgegangen wird. Sie schlägt außerdem eine dynamische Datenkuratierungspipeline vor, um die Schwierigkeit des Benchmarks im Laufe der Zeit aufrechtzuerhalten, sowie ein feingranulares Evaluierungsprotokoll, um das Modellverhalten zu entflechten.

Retrieval Augmented Generation hallucination Benchmarking LVLM

RESEARCHarXiv CS.CL·4/30/2026

CogRAG+: Cognitive-Level Guided Diagnosis and Remediation of Memory and Reasoning Deficiencies in Professional Exam QA

CogRAG+ ist ein trainingsfreies Framework zur Diagnose und Behebung von Gedächtnis- und Denkdefiziten in großen Sprachmodellen bei professionellen Prüfungsfragen. Es entkoppelt und richtet Abruf und Schlussfolgerung an menschlichen kognitiven Hierarchien aus, indem es Reinforced Retrieval und kognitionsgeschichtetes Constrained Reasoning einsetzt, um Genauigkeit und Konsistenz zu verbessern.

Retrieval Augmented Generation natural language processing AI Reasoning large language models

RESEARCHarXiv CS.CL·5/8/2026

AdaGATE: Adaptive Gap-Aware Token-Efficient Evidence Assembly for Multi-Hop Retrieval-Augmented Generation

AdaGATE ist ein trainingsfreier Evidenz-Controller für Multi-Hop Retrieval-Augmented Generation (RAG), der entwickelt wurde, um verrauschte oder redundante abgerufene Evidenz in begrenzten Kontexten zu adressieren. Es fasst die Evidenzauswahl als token-beschränktes Reparaturproblem auf und kombiniert lückenorientiertes Tracking und zielgerichtete Mikro-Anfragen, um Abdeckung, Bestätigung und Neuheit auszugleichen.

Retrieval Augmented Generation AI models Multi-hop RAG Evidence Selection

RESEARCHarXiv CS.CL·vor 8T

CanLegalRAGBench: Evaluating Retrieval-Augmented Generation on Canadian Case Law

Diese Arbeit stellt CanLegalRAGBench vor, einen neuen kanadischen Rechts-QA-Benchmark zur Bewertung von Retrieval-Augmented Generation (RAG)-Systemen mit realistischen Anfragen und von Experten annotierten Fallrecht-Antworten. Sie zeigt die Sensibilität der Retrieval-Leistung, die Wettbewerbsfähigkeit von Open-Source-Embedding-Modellen sowie die Grenzen automatischer Bewertungen und LLM-Halluzinationen in generierten Antworten auf.

Retrieval Augmented Generation LLMs evaluation Legal AI

RESEARCHarXiv CS.CL·4/30/2026

Generative AI-Based Virtual Assistant using Retrieval-Augmented Generation: An evaluation study for bachelor projects

Diese Arbeit evaluiert einen auf generativer KI basierenden virtuellen Assistenten, der Retrieval-Augmented Generation (RAG) einsetzt, um Studenten der Universität Maastricht bei Projektvorschriften zu unterstützen. Das System zielt darauf ab, Herausforderungen wie Halluzinationen zu begegnen und genaue, kontextspezifische Antworten durch die Integration von domänenspezifischem Wissen zu liefern.

Retrieval Augmented Generation education Virtual Assistants large language models