← heapsort-ai

Retrieval Augmented Generation

13 items

RESEARCHarXiv CS.CL·19h atrás

Retrieval Augmented Generation Framework for the Nepali Legal Domain Question Answering

Este estudo apresenta a primeira aplicação de um modelo de Geração Aumentada por Recuperação (RAG) para resposta a perguntas jurídicas em nepalês, abordando a escassez de dados em idiomas com poucos recursos. Utilizando BM25 em documentos segmentados, o pipeline RAG alcançou alta precisão e veracidade, demonstrando sua eficácia no domínio jurídico nepalês.

54
RESEARCHarXiv CS.CL·23/04/2026

Cognis: Context-Aware Memory for Conversational AI Agents

Lyzr Cognis apresenta uma arquitetura de memória unificada para agentes de IA conversacionais, superando a falta de memória persistente através de um pipeline de recuperação multi-estágio. Ele combina um backend de armazenamento duplo, ingestão consciente do contexto e aprimoramento temporal, alcançando desempenho de ponta em dois benchmarks independentes.

31
RESEARCHarXiv CS.CL·06/04/2026

Principled and Scalable Diversity-Aware Retrieval via Cardinality-Constrained Binary Quadratic Programming

Este trabalho propõe uma formulação rigorosa para a recuperação consciente da diversidade em Geração Aumentada por Recuperação (RAG), abordando a falta de garantias teóricas e escalabilidade dos métodos existentes. A solução utiliza programação quadrática binária com restrição de cardinalidade (CCBQP) e um algoritmo baseado em Frank-Wolfe, demonstrando desempenho superior na fronteira de Pareto de relevância-diversidade e maior velocidade.

28
RESEARCHarXiv CS.AI·01/05/2026

Think it, Run it: Autonomous ML pipeline generation via self-healing multi-agent AI

Este artigo propõe uma arquitetura unificada de IA multiagente para automatizar a geração de pipelines de aprendizado de máquina (ML) de ponta a ponta a partir de dados e metas em linguagem natural. O sistema de cinco agentes integra RAG, um recomendador híbrido explicável e um mecanismo de autocorreção baseado em LLM, alcançando uma taxa de sucesso de 84,7% e robustez aprimorada.

27
DOCDEV.to AI·27/04/2026

From Static Data to Conversational AI: Building a RAG-Powered Customer Agent (Part 2)

A Parte 2 desta série foca na construção da interface e do motor de raciocínio para um agente de atendimento ao cliente baseado em RAG. O guia detalha como conectar um front-end de mensagens (Telegram Bot API) a um banco de dados vetorial (Pinecone) e um LLM usando Make.com para fornecer respostas precisas em tempo real.

27
RESEARCHarXiv CS.CL·15/04/2026

Benchmarking Deflection and Hallucination in Large Vision-Language Models

Este artigo propõe um novo benchmark, VLM-DeflectionBench, para Large Vision-Language Models (LVLMs) que aborda a deflexão e a alucinação em cenários de evidências conflitantes ou insuficientes. Ele também introduz uma pipeline de curadoria de dados dinâmica para manter a relevância do benchmark e um protocolo de avaliação detalhado para analisar o comportamento do modelo.

27
RESEARCHarXiv CS.CL·30/04/2026

CogRAG+: Cognitive-Level Guided Diagnosis and Remediation of Memory and Reasoning Deficiencies in Professional Exam QA

CogRAG+ é uma estrutura sem treinamento que visa diagnosticar e remediar deficiências de memória e raciocínio em LLMs para exames profissionais. Ela desacopla e alinha a recuperação e o raciocínio com hierarquias cognitivas humanas para melhorar a precisão e a consistência, utilizando estratégias como Reinforced Retrieval e Constrained Reasoning.

27
RESEARCHarXiv CS.CL·08/05/2026

AdaGATE: Adaptive Gap-Aware Token-Efficient Evidence Assembly for Multi-Hop Retrieval-Augmented Generation

AdaGATE é um controlador de evidências para Geração Aumentada por Recuperação (RAG) multi-salto que resolve problemas de evidência ruidosa ou redundante, com foco em contextos limitados. Ele enquadra a seleção de evidências como um problema de reparo com restrição de tokens, combinando rastreamento de lacunas e geração de micro-consultas para otimizar cobertura, corroboração e novidade.

27
RESEARCHarXiv CS.CL·8d atrás

CanLegalRAGBench: Evaluating Retrieval-Augmented Generation on Canadian Case Law

Este artigo introduz o CanLegalRAGBench, um novo benchmark para avaliação de modelos RAG em direito canadense, utilizando consultas realistas e respostas anotadas por especialistas. A pesquisa destaca a sensibilidade do desempenho de recuperação, a competitividade de modelos de embedding open-source e as limitações das avaliações automáticas e as alucinações em respostas geradas por LLMs.

27
RESEARCHarXiv CS.CL·30/04/2026

Generative AI-Based Virtual Assistant using Retrieval-Augmented Generation: An evaluation study for bachelor projects

Este artigo avalia um assistente virtual baseado em IA Generativa que utiliza Geração Aumentada por Recuperação (RAG) para auxiliar estudantes da Universidade de Maastricht com regulamentos de projetos. O sistema busca resolver desafios como alucinações e fornecer respostas precisas e contextuais ao integrar conhecimento específico do domínio.

27