← heapsort-ai

Retrieval Augmented Generation

13 items

RESEARCHarXiv CS.CL·il y a 20h

Retrieval Augmented Generation Framework for the Nepali Legal Domain Question Answering

Cette étude présente la première application d'un modèle de Génération Augmentée par Récupération (RAG) pour la réponse aux questions juridiques en népalais, abordant la rareté des données dans les langues à faibles ressources. En utilisant BM25 sur des documents segmentés, le pipeline RAG a atteint une grande précision et véracité, démontrant son efficacité dans le domaine juridique népalais.

54
RESEARCHarXiv CS.CL·23/04/2026

Cognis: Context-Aware Memory for Conversational AI Agents

Lyzr Cognis propose une architecture de mémoire unifiée pour les agents d'IA conversationnels, palliant le manque de mémoire persistante grâce à un pipeline de récupération multi-étapes. Il combine un backend à double stockage, une ingestion contextuelle et une amélioration temporelle, atteignant des performances de pointe sur deux benchmarks indépendants.

31
RESEARCHarXiv CS.AI·15/04/2026

Memory as Metabolism: A Design for Companion Knowledge Systems

Cet article propose un profil de gouvernance spécifique pour les systèmes de connaissance de compagnons, en se concentrant sur le mode d'échec de l'enracinement sous la dérive couplée à l'utilisateur. Il examine les architectures de mémoire d'IA personnelles émergentes et existantes, y compris RAG et les wikis personnels, dans le paysage de 2026.

28
RESEARCHarXiv CS.CL·06/04/2026

Principled and Scalable Diversity-Aware Retrieval via Cardinality-Constrained Binary Quadratic Programming

Este trabalho propõe uma formulação rigorosa para a recuperação consciente da diversidade em Geração Aumentada por Recuperação (RAG), abordando a falta de garantias teóricas e escalabilidade dos métodos existentes. A solução utiliza programação quadrática binária com restrição de cardinalidade (CCBQP) e um algoritmo baseado em Frank-Wolfe, demonstrando desempenho superior na fronteira de Pareto de relevância-diversidade e maior velocidade.

28
RESEARCHarXiv CS.AI·01/05/2026

Think it, Run it: Autonomous ML pipeline generation via self-healing multi-agent AI

Cet article propose une architecture d'IA multi-agents unifiée pour automatiser la génération de pipelines d'apprentissage automatique (ML) de bout en bout à partir de jeux de données et d'objectifs en langage naturel. Le système à cinq agents intègre RAG, un recommandeur hybride explicable et un mécanisme d'auto-réparation basé sur les LLM, atteignant un taux de réussite de 84,7% et une robustesse améliorée.

27
DOCDEV.to AI·27/04/2026

From Static Data to Conversational AI: Building a RAG-Powered Customer Agent (Part 2)

La deuxième partie de cette série se concentre sur la construction de l'interface et du moteur de raisonnement pour un agent client basé sur RAG. Elle explique comment connecter une interface de messagerie (Telegram Bot API) à une base de données vectorielle (Pinecone) et un LLM en utilisant Make.com pour des réponses précises en temps réel.

27
DOCDEV.to AI·01/05/2026

Prompt engineering techniques

Ce document décrit une technique d'ingénierie d'invites qui améliore la qualité des réponses des modèles d'IA en remplaçant les exemples statiques par des exemples sémantiquement similaires récupérés d'une base de données vectorielle. Cela implique d'indexer les conversations réussies et d'injecter les exemples les plus pertinents dans l'invite du système pour des tâches complexes.

27
RESEARCHarXiv CS.CL·15/04/2026

Benchmarking Deflection and Hallucination in Large Vision-Language Models

Cet article propose VLM-DeflectionBench, un nouveau benchmark pour les Large Vision-Language Models (LVLM) qui s'attaque à la déviation et à l'hallucination face à des preuves conflictuelles ou insuffisantes. Il introduit également un pipeline dynamique de curation de données pour maintenir la pertinence du benchmark et un protocole d'évaluation détaillé.

27
RESEARCHarXiv CS.CL·30/04/2026

CogRAG+: Cognitive-Level Guided Diagnosis and Remediation of Memory and Reasoning Deficiencies in Professional Exam QA

CogRAG+ est un cadre sans entraînement conçu pour diagnostiquer et remédier aux lacunes de mémoire et de raisonnement des grands modèles linguistiques dans les examens professionnels. Il découple et aligne la récupération et le raisonnement avec les hiérarchies cognitives humaines, employant le Reinforced Retrieval et le Constrained Reasoning pour améliorer la précision et la cohérence.

27
RESEARCHarXiv CS.CL·08/05/2026

AdaGATE: Adaptive Gap-Aware Token-Efficient Evidence Assembly for Multi-Hop Retrieval-Augmented Generation

AdaGATE est un contrôleur de preuves sans entraînement pour la Génération Augmentée par Récupération (RAG) multi-sauts, conçu pour gérer les preuves bruyantes ou redondantes dans des contextes limités. Il considère la sélection de preuves comme un problème de réparation contraint par les jetons, utilisant le suivi des lacunes et la génération de micro-requêtes pour équilibrer la couverture, la corroboration et la nouveauté.

27
RESEARCHarXiv CS.CL·il y a 8j

CanLegalRAGBench: Evaluating Retrieval-Augmented Generation on Canadian Case Law

Cette recherche introduit CanLegalRAGBench, un nouveau benchmark canadien pour l'évaluation des systèmes de Génération Augmentée par Récupération (RAG) sur des questions juridiques, avec des requêtes réalistes et des réponses annotées par des experts. L'étude révèle la sensibilité de la performance de récupération, la compétitivité des modèles d'embedding open-source et les limites des évaluations automatiques et des hallucinations des LLM.

27
RESEARCHarXiv CS.CL·30/04/2026

Generative AI-Based Virtual Assistant using Retrieval-Augmented Generation: An evaluation study for bachelor projects

Cet article évalue un assistant virtuel basé sur l'IA générative utilisant la génération augmentée par récupération (RAG) pour aider les étudiants de l'Université de Maastricht avec les règlements de projet. Le système vise à résoudre les problèmes d'hallucinations et à fournir des réponses précises et spécifiques au contexte en intégrant des connaissances spécifiques au domaine.

27