Retrieval Augmented Generation

13 items

RESEARCHarXiv CS.CL·19h atrás

Retrieval Augmented Generation Framework for the Nepali Legal Domain Question Answering

Este estudo apresenta a primeira aplicação de um modelo de Geração Aumentada por Recuperação (RAG) para resposta a perguntas jurídicas em nepalês, abordando a escassez de dados em idiomas com poucos recursos. Utilizando BM25 em documentos segmentados, o pipeline RAG alcançou alta precisão e veracidade, demonstrando sua eficácia no domínio jurídico nepalês.

Retrieval Augmented Generation Legal AI Question Answering natural language processing

RESEARCHarXiv CS.CL·23/04/2026

Cognis: Context-Aware Memory for Conversational AI Agents

Lyzr Cognis apresenta uma arquitetura de memória unificada para agentes de IA conversacionais, superando a falta de memória persistente através de um pipeline de recuperação multi-estágio. Ele combina um backend de armazenamento duplo, ingestão consciente do contexto e aprimoramento temporal, alcançando desempenho de ponta em dois benchmarks independentes.

Retrieval Augmented Generation research memory Conversational AI

RESEARCHarXiv CS.AI·15/04/2026

Memory as Metabolism: A Design for Companion Knowledge Systems

Este artigo propõe um perfil de governança específico para sistemas de conhecimento de companhia, abordando o modo de falha de entrincheiramento sob deriva acoplada ao usuário. Ele contextualiza esse design dentro do panorama de arquiteturas de memória de IA emergentes e existentes, incluindo RAG e wikis pessoais, no cenário de 2026.

Retrieval Augmented Generation LLMs Companion AI knowledge systems

ARTICLEDEV.to AI·25d atrás

Why your local LLM knowledge base gives bad answers (and how to fix it)

Muitos LLMs locais fornecem respostas ruins a partir de bases de conhecimento pessoais devido a problemas na camada de recuperação, e não no modelo em si. Este artigo explora a frustração e o funcionamento da pipeline de recuperação.

Retrieval Augmented Generation knowledge base Local AI LLM

RESEARCHarXiv CS.CL·06/04/2026

Principled and Scalable Diversity-Aware Retrieval via Cardinality-Constrained Binary Quadratic Programming

Este trabalho propõe uma formulação rigorosa para a recuperação consciente da diversidade em Geração Aumentada por Recuperação (RAG), abordando a falta de garantias teóricas e escalabilidade dos métodos existentes. A solução utiliza programação quadrática binária com restrição de cardinalidade (CCBQP) e um algoritmo baseado em Frank-Wolfe, demonstrando desempenho superior na fronteira de Pareto de relevância-diversidade e maior velocidade.

Retrieval Augmented Generation Scalability Diversity-aware Retrieval Binary Quadratic Programming

RESEARCHarXiv CS.AI·01/05/2026

Think it, Run it: Autonomous ML pipeline generation via self-healing multi-agent AI

Este artigo propõe uma arquitetura unificada de IA multiagente para automatizar a geração de pipelines de aprendizado de máquina (ML) de ponta a ponta a partir de dados e metas em linguagem natural. O sistema de cinco agentes integra RAG, um recomendador híbrido explicável e um mecanismo de autocorreção baseado em LLM, alcançando uma taxa de sucesso de 84,7% e robustez aprimorada.

Retrieval Augmented Generation multi-agent AI large language models ML Automation

DOCDEV.to AI·27/04/2026

From Static Data to Conversational AI: Building a RAG-Powered Customer Agent (Part 2)

A Parte 2 desta série foca na construção da interface e do motor de raciocínio para um agente de atendimento ao cliente baseado em RAG. O guia detalha como conectar um front-end de mensagens (Telegram Bot API) a um banco de dados vetorial (Pinecone) e um LLM usando Make.com para fornecer respostas precisas em tempo real.

Retrieval Augmented Generation LLMs Vector Databases customer service AI

DOCDEV.to AI·01/05/2026

Prompt engineering techniques

Este documento descreve uma técnica de engenharia de prompt que melhora a qualidade das respostas de modelos de IA, substituindo exemplos estáticos por exemplos semanticamente similares recuperados de um banco de dados vetorial. Isso envolve indexar conversas bem-sucedidas e injetar os exemplos mais relevantes no prompt do sistema para tarefas complexas.

Retrieval Augmented Generation AI models prompt engineering Vector Databases

RESEARCHarXiv CS.CL·15/04/2026

Benchmarking Deflection and Hallucination in Large Vision-Language Models

Este artigo propõe um novo benchmark, VLM-DeflectionBench, para Large Vision-Language Models (LVLMs) que aborda a deflexão e a alucinação em cenários de evidências conflitantes ou insuficientes. Ele também introduz uma pipeline de curadoria de dados dinâmica para manter a relevância do benchmark e um protocolo de avaliação detalhado para analisar o comportamento do modelo.

Retrieval Augmented Generation hallucination Benchmarking LVLM

RESEARCHarXiv CS.CL·30/04/2026

CogRAG+: Cognitive-Level Guided Diagnosis and Remediation of Memory and Reasoning Deficiencies in Professional Exam QA

CogRAG+ é uma estrutura sem treinamento que visa diagnosticar e remediar deficiências de memória e raciocínio em LLMs para exames profissionais. Ela desacopla e alinha a recuperação e o raciocínio com hierarquias cognitivas humanas para melhorar a precisão e a consistência, utilizando estratégias como Reinforced Retrieval e Constrained Reasoning.

Retrieval Augmented Generation natural language processing AI Reasoning large language models

RESEARCHarXiv CS.CL·08/05/2026

AdaGATE: Adaptive Gap-Aware Token-Efficient Evidence Assembly for Multi-Hop Retrieval-Augmented Generation

AdaGATE é um controlador de evidências para Geração Aumentada por Recuperação (RAG) multi-salto que resolve problemas de evidência ruidosa ou redundante, com foco em contextos limitados. Ele enquadra a seleção de evidências como um problema de reparo com restrição de tokens, combinando rastreamento de lacunas e geração de micro-consultas para otimizar cobertura, corroboração e novidade.

Retrieval Augmented Generation AI models Multi-hop RAG Evidence Selection

RESEARCHarXiv CS.CL·8d atrás

CanLegalRAGBench: Evaluating Retrieval-Augmented Generation on Canadian Case Law

Este artigo introduz o CanLegalRAGBench, um novo benchmark para avaliação de modelos RAG em direito canadense, utilizando consultas realistas e respostas anotadas por especialistas. A pesquisa destaca a sensibilidade do desempenho de recuperação, a competitividade de modelos de embedding open-source e as limitações das avaliações automáticas e as alucinações em respostas geradas por LLMs.

Retrieval Augmented Generation LLMs evaluation Legal AI

RESEARCHarXiv CS.CL·30/04/2026

Generative AI-Based Virtual Assistant using Retrieval-Augmented Generation: An evaluation study for bachelor projects

Este artigo avalia um assistente virtual baseado em IA Generativa que utiliza Geração Aumentada por Recuperação (RAG) para auxiliar estudantes da Universidade de Maastricht com regulamentos de projetos. O sistema busca resolver desafios como alucinações e fornecer respostas precisas e contextuais ao integrar conhecimento específico do domínio.

Retrieval Augmented Generation education Virtual Assistants large language models