← heapsort-ai

RAG

151 items

ARTICLEDEV.to AI·2h atrás

Why We Replaced Short-Term Chat History With Hindsight

Este artigo aborda os desafios de manter o histórico de conversas de longo prazo para uma plataforma de vendas alimentada por IA, onde métodos tradicionais falharam. Ele apresenta um Loop de Retenção-Recordação persistente usando Hindsight como solução para evitar que a IA esqueça detalhes cruciais em ciclos de vendas prolongados.

62
ARTICLEDEV.to AI·23/04/2026

How I built an AI RAG system to convert PDF to Q&As

Este artigo detalha as cinco etapas de engenharia para construir um sistema AI RAG chamado LongTermMemory, que transforma PDFs em perguntas e respostas. Abrange a pipeline completa de processamento de documentos, desde a extração de texto e fragmentação semântica até o uso de um banco de dados vetorial e Geração Aumentada por Recuperação (RAG), com um backend em Laravel e FastAPI.

49
ARTICLE↑ trendingReddit r/MachineLearning·27/04/2026

Three limitations I keep hitting with retrieval-augmented generation in production and I'm running out of ideas [D]

Um usuário descreve as limitações de um sistema RAG em produção no domínio legal, notadamente o problema de "dispersão" onde as respostas ficam incompletas ao exigir informações de muitos documentos distintos. Ele explora soluções como a decomposição de consultas para resolver este problema persistente.

42
RESEARCHarXiv CS.CL·1d atrás

MM-BizRAG: Rethinking Multimodal Retrieval-Augmented Generation for General Purpose Enterprise Q&A

MM-BizRAG propõe uma abordagem direta para geração aumentada por recuperação multimodal em Q&A corporativo, lidando explicitamente com informações estruturadas em documentos complexos. Utiliza uma divisão sensível à estrutura do documento e pipelines de ingestão específicos de orientação para processar melhor vários tipos de documentos.

40
RESEARCHarXiv CS.CL·1d atrás

When Retrieval Doesn't Help: A Large-Scale Study of Biomedical RAG

Um estudo em larga escala reavalia a Geração Aumentada por Recuperação (RAG) em resposta a perguntas médicas, encontrando apenas melhorias pequenas e inconsistentes em relação às linhas de base sem recuperação. Ele sugere que a escolha do modelo base é mais crítica do que os métodos de recuperação, e o principal gargalo é a capacidade do modelo de usar evidências recuperadas de forma eficaz.

40
DOCDEV.to AI·3d atrás

flowise-local-setup-guide

Este artigo é um guia para configurar o Flowise, uma ferramenta de arrastar e soltar para construir pipelines LLM, como chatbots RAG, sem escrever código. Ele enfatiza a execução local, a conexão com Ollama e a interface de edição visual baseada em nós para criar aplicações de IA.

40
NEWS↑ trendingReddit r/LocalLLaMA·12/04/2026

Weekend project with Intel B70s

O usuário está montando um sistema com GPUs Intel Arc B70, placa-mãe Gigabyte B850 AI Top e outros componentes de ponta para testar o modelo Gemma 4 em aplicações de RAG legal utilizando um agente Hermes.

38
ARTICLEDEV.to AI·23/04/2026

Retrieval-Augmented Generation: State of the Art and Future Directions

A Geração Aumentada por Recuperação (RAG) continua essencial para superar as limitações dos Grandes Modelos de Linguagem (LLMs), como alucinações e conhecimento desatualizado, ao integrar sistemas de recuperação externos. O texto descreve a evolução do RAG de um design linear simples para uma arquitetura em camadas mais robusta em sistemas de produção.

37
ARTICLE↑ trendingReddit r/LocalLLaMA·11/04/2026

Dual A100X local workflow

O autor utilizou GPUs A100X para desenvolver um fluxo de trabalho RAG, permitindo que um modelo de IA local acesse um banco de dados de inventário. A interação dos usuários ocorre através de uma interface web aberta, proporcionando uma valiosa experiência de aprendizado.

36
ARTICLEDEV.to AI·22/04/2026

I Built a Swarm Agent RAG System Inspired by Karpathy's LLM Wiki

Este artigo apresenta o "rag-swarm", um sistema RAG multimodal que utiliza agentes especializados em swarm para pesquisa paralela, superando as limitações dos sistemas RAG tradicionais com um único retriever para bases de conhecimento diversas. A arquitetura é inspirada no design de três camadas da LLM Wiki de Karpathy, focando na substituição do caminho de busca único por um swarm coordenado de agentes.

36
ARTICLEDEV.to AI·19/04/2026

Aprenda avaliar a qualidade do seu agente de AI, RAG e LLM

O autor aborda a importância e o desconhecimento sobre a avaliação (evals) de sistemas de IA, como agentes, RAG e LLMs, explicando que irá apresentar as principais métricas e frameworks. O artigo visa ensinar a melhorar a qualidade de entrega de projetos de IA, combinando teoria e prática, com um repositório de estudo utilizando Openrouter.

33