Retrieval Augmented Generation

13 items

RESEARCHarXiv CS.CL·hace 23h

Retrieval Augmented Generation Framework for the Nepali Legal Domain Question Answering

Este estudio presenta la primera aplicación de un modelo de Generación Aumentada por Recuperación (RAG) para la respuesta a preguntas legales en nepalí, abordando la escasez de datos en idiomas de bajos recursos. Utilizando BM25 en documentos fragmentados, el pipeline RAG logró alta precisión y veracidad, demostrando su eficacia en el dominio legal nepalí.

Retrieval Augmented Generation Legal AI Question Answering Natural Language Processing

RESEARCHarXiv CS.CL·23/4/2026

Cognis: Context-Aware Memory for Conversational AI Agents

Lyzr Cognis presenta una arquitectura de memoria unificada para agentes de IA conversacionales, solucionando la falta de memoria persistente mediante un pipeline de recuperación multi-etapa. Combina un backend de doble almacén, ingestión consciente del contexto y mejora temporal, logrando un rendimiento de vanguardia en dos benchmarks independientes.

Retrieval Augmented Generation research memory Conversational AI

RESEARCHarXiv CS.AI·15/4/2026

Memory as Metabolism: A Design for Companion Knowledge Systems

Este artículo propone un perfil de gobernanza específico para sistemas de conocimiento de compañía, abordando el modo de fallo del atrincheramiento bajo la deriva acoplada al usuario. Discute las arquitecturas de memoria de IA personales emergentes y existentes, incluyendo RAG y wikis de estilo personal, dentro del panorama de 2026.

Retrieval Augmented Generation LLMs Companion AI knowledge systems

ARTICLEDEV.to AI·hace 25d

Why your local LLM knowledge base gives bad answers (and how to fix it)

Muchos LLM locales dan malas respuestas de bases de conocimiento personales debido a problemas en la capa de recuperación, no en el modelo en sí. Este artículo explora la frustración y el funcionamiento de la tubería de recuperación.

Retrieval Augmented Generation knowledge base Local AI LLM

RESEARCHarXiv CS.CL·6/4/2026

Principled and Scalable Diversity-Aware Retrieval via Cardinality-Constrained Binary Quadratic Programming

Este trabalho propõe uma formulação rigorosa para a recuperação consciente da diversidade em Geração Aumentada por Recuperação (RAG), abordando a falta de garantias teóricas e escalabilidade dos métodos existentes. A solução utiliza programação quadrática binária com restrição de cardinalidade (CCBQP) e um algoritmo baseado em Frank-Wolfe, demonstrando desempenho superior na fronteira de Pareto de relevância-diversidade e maior velocidade.

Retrieval Augmented Generation Scalability Diversity-aware Retrieval Binary Quadratic Programming

RESEARCHarXiv CS.AI·1/5/2026

Think it, Run it: Autonomous ML pipeline generation via self-healing multi-agent AI

Este artículo propone una arquitectura unificada de IA multiagente para automatizar la generación de pipelines de aprendizaje automático (ML) de principio a fin a partir de conjuntos de datos y objetivos en lenguaje natural. El sistema de cinco agentes integra RAG, un recomendador híbrido explicable y un mecanismo de auto-curación basado en LLM, logrando una tasa de éxito del 84,7% y una mayor robustez.

Retrieval Augmented Generation multi-agent AI large language models ML Automation

DOCDEV.to AI·27/4/2026

From Static Data to Conversational AI: Building a RAG-Powered Customer Agent (Part 2)

La Parte 2 de esta serie se centra en construir la interfaz y el motor de razonamiento para un agente de cliente impulsado por RAG. Explica cómo conectar un front-end de mensajería (Telegram Bot API) a una base de datos vectorial (Pinecone) y un LLM usando Make.com para proporcionar respuestas precisas en tiempo real.

Retrieval Augmented Generation LLMs Vector Databases customer service AI

DOCDEV.to AI·1/5/2026

Prompt engineering techniques

Este documento describe una técnica de ingeniería de prompts que mejora la calidad de las respuestas de los modelos de IA, reemplazando ejemplos estáticos con ejemplos semánticamente similares recuperados de una base de datos vectorial. Esto implica indexar conversaciones exitosas e inyectar los ejemplos más relevantes en el prompt del sistema para tareas complejas.

Retrieval Augmented Generation AI models prompt-engineering Vector Databases

RESEARCHarXiv CS.CL·15/4/2026

Benchmarking Deflection and Hallucination in Large Vision-Language Models

Este artículo propone VLM-DeflectionBench, un nuevo benchmark para Large Vision-Language Models (LVLMs) que aborda la deflexión y la alucinación en escenarios con evidencia conflictiva o insuficiente. También introduce un pipeline de curación de datos dinámico para preservar la dificultad del benchmark y un protocolo de evaluación detallado para analizar el comportamiento del modelo.

Retrieval Augmented Generation hallucination Benchmarking LVLM

RESEARCHarXiv CS.CL·30/4/2026

CogRAG+: Cognitive-Level Guided Diagnosis and Remediation of Memory and Reasoning Deficiencies in Professional Exam QA

CogRAG+ es un marco sin entrenamiento diseñado para diagnosticar y remediar deficiencias de memoria y razonamiento en LLMs para exámenes profesionales. Desacopla y alinea la recuperación y el razonamiento con jerarquías cognitivas humanas, utilizando estrategias como Reinforced Retrieval y Constrained Reasoning para mejorar la precisión y consistencia.

Retrieval Augmented Generation Natural Language Processing AI Reasoning large language models

RESEARCHarXiv CS.CL·8/5/2026

AdaGATE: Adaptive Gap-Aware Token-Efficient Evidence Assembly for Multi-Hop Retrieval-Augmented Generation

AdaGATE es un controlador de evidencia sin entrenamiento para la Generación Aumentada por Recuperación (RAG) de múltiples saltos, diseñado para abordar la evidencia ruidosa o redundante en contextos limitados. Enfoca la selección de evidencia como un problema de reparación con restricción de tokens, combinando el seguimiento de brechas y la generación de micro-consultas para equilibrar cobertura, corroboración y novedad.

Retrieval Augmented Generation AI models Multi-hop RAG Evidence Selection

RESEARCHarXiv CS.CL·hace 8d

CanLegalRAGBench: Evaluating Retrieval-Augmented Generation on Canadian Case Law

Este estudio presenta CanLegalRAGBench, un nuevo benchmark canadiense para evaluar sistemas de Generación Aumentada por Recuperación (RAG) en derecho, utilizando consultas realistas y respuestas anotadas por expertos. La investigación revela la sensibilidad del rendimiento de recuperación, la competitividad de los modelos de incrustación de código abierto y las limitaciones de las evaluaciones automáticas y las alucinaciones de los LLM.

Retrieval Augmented Generation LLMs evaluation Legal AI

RESEARCHarXiv CS.CL·30/4/2026

Generative AI-Based Virtual Assistant using Retrieval-Augmented Generation: An evaluation study for bachelor projects

Este artículo evalúa un asistente virtual basado en IA Generativa que utiliza Generación Aumentada por Recuperación (RAG) para apoyar a estudiantes de la Universidad de Maastricht con regulaciones de proyectos. El sistema busca abordar desafíos como las alucinaciones y proporcionar respuestas precisas y contextuales integrando conocimiento específico del dominio.

Retrieval Augmented Generation education Virtual Assistants large language models