← heapsort-ai

Retrieval Augmented Generation

13 items

RESEARCHarXiv CS.CL·hace 23h

Retrieval Augmented Generation Framework for the Nepali Legal Domain Question Answering

Este estudio presenta la primera aplicación de un modelo de Generación Aumentada por Recuperación (RAG) para la respuesta a preguntas legales en nepalí, abordando la escasez de datos en idiomas de bajos recursos. Utilizando BM25 en documentos fragmentados, el pipeline RAG logró alta precisión y veracidad, demostrando su eficacia en el dominio legal nepalí.

46
RESEARCHarXiv CS.CL·23/4/2026

Cognis: Context-Aware Memory for Conversational AI Agents

Lyzr Cognis presenta una arquitectura de memoria unificada para agentes de IA conversacionales, solucionando la falta de memoria persistente mediante un pipeline de recuperación multi-etapa. Combina un backend de doble almacén, ingestión consciente del contexto y mejora temporal, logrando un rendimiento de vanguardia en dos benchmarks independientes.

31
RESEARCHarXiv CS.CL·6/4/2026

Principled and Scalable Diversity-Aware Retrieval via Cardinality-Constrained Binary Quadratic Programming

Este trabalho propõe uma formulação rigorosa para a recuperação consciente da diversidade em Geração Aumentada por Recuperação (RAG), abordando a falta de garantias teóricas e escalabilidade dos métodos existentes. A solução utiliza programação quadrática binária com restrição de cardinalidade (CCBQP) e um algoritmo baseado em Frank-Wolfe, demonstrando desempenho superior na fronteira de Pareto de relevância-diversidade e maior velocidade.

28
RESEARCHarXiv CS.AI·1/5/2026

Think it, Run it: Autonomous ML pipeline generation via self-healing multi-agent AI

Este artículo propone una arquitectura unificada de IA multiagente para automatizar la generación de pipelines de aprendizaje automático (ML) de principio a fin a partir de conjuntos de datos y objetivos en lenguaje natural. El sistema de cinco agentes integra RAG, un recomendador híbrido explicable y un mecanismo de auto-curación basado en LLM, logrando una tasa de éxito del 84,7% y una mayor robustez.

27
RESEARCHarXiv CS.CL·15/4/2026

Benchmarking Deflection and Hallucination in Large Vision-Language Models

Este artículo propone VLM-DeflectionBench, un nuevo benchmark para Large Vision-Language Models (LVLMs) que aborda la deflexión y la alucinación en escenarios con evidencia conflictiva o insuficiente. También introduce un pipeline de curación de datos dinámico para preservar la dificultad del benchmark y un protocolo de evaluación detallado para analizar el comportamiento del modelo.

27
RESEARCHarXiv CS.CL·30/4/2026

CogRAG+: Cognitive-Level Guided Diagnosis and Remediation of Memory and Reasoning Deficiencies in Professional Exam QA

CogRAG+ es un marco sin entrenamiento diseñado para diagnosticar y remediar deficiencias de memoria y razonamiento en LLMs para exámenes profesionales. Desacopla y alinea la recuperación y el razonamiento con jerarquías cognitivas humanas, utilizando estrategias como Reinforced Retrieval y Constrained Reasoning para mejorar la precisión y consistencia.

27
RESEARCHarXiv CS.CL·8/5/2026

AdaGATE: Adaptive Gap-Aware Token-Efficient Evidence Assembly for Multi-Hop Retrieval-Augmented Generation

AdaGATE es un controlador de evidencia sin entrenamiento para la Generación Aumentada por Recuperación (RAG) de múltiples saltos, diseñado para abordar la evidencia ruidosa o redundante en contextos limitados. Enfoca la selección de evidencia como un problema de reparación con restricción de tokens, combinando el seguimiento de brechas y la generación de micro-consultas para equilibrar cobertura, corroboración y novedad.

27
RESEARCHarXiv CS.CL·hace 8d

CanLegalRAGBench: Evaluating Retrieval-Augmented Generation on Canadian Case Law

Este estudio presenta CanLegalRAGBench, un nuevo benchmark canadiense para evaluar sistemas de Generación Aumentada por Recuperación (RAG) en derecho, utilizando consultas realistas y respuestas anotadas por expertos. La investigación revela la sensibilidad del rendimiento de recuperación, la competitividad de los modelos de incrustación de código abierto y las limitaciones de las evaluaciones automáticas y las alucinaciones de los LLM.

27
RESEARCHarXiv CS.CL·30/4/2026

Generative AI-Based Virtual Assistant using Retrieval-Augmented Generation: An evaluation study for bachelor projects

Este artículo evalúa un asistente virtual basado en IA Generativa que utiliza Generación Aumentada por Recuperación (RAG) para apoyar a estudiantes de la Universidad de Maastricht con regulaciones de proyectos. El sistema busca abordar desafíos como las alucinaciones y proporcionar respuestas precisas y contextuales integrando conocimiento específico del dominio.

27