Information Retrieval

36 items

RESEARCHarXiv CS.CL·il y a 20h

Bidirectional Small-Granularity Search between Code and Text

Cette recherche introduit une nouvelle tâche de recherche bidirectionnelle à petite granularité entre code et texte, visant à lier les publications scientifiques aux segments de code correspondants. Elle propose un grand ensemble de données, partiellement généré par GPT-4, et une approche modulaire qui obtient de bons résultats.

machine learning natural language processing Code Analysis Information Retrieval

ARTICLE↑ trendingHacker News (AI)·il y a 7j

RSS is back. AI agents are reading it

Le RSS connaît un regain d'intérêt en tant que moyen efficace pour les agents d'IA de consommer du contenu web, offrant un flux d'informations structuré et à jour. Cela permet aux modèles d'IA d'accéder et de traiter de grands volumes de données plus efficacement, marquant un nouveau chapitre pour cette technologie autrefois considérée comme obsolète.

RSS news aggregation Information Retrieval AI agents

ARTICLE↑ trendingReddit r/MachineLearning·17/04/2026

SIGIR-AP: Good conference for IR? [D]

Un chercheur universitaire intéressé par la Recherche d'Information (RI) demande conseil sur des conférences académiques moins compétitives pour soumettre son travail. Il s'interroge sur la qualité de SIGIR-AP, une nouvelle conférence soutenue par SIGIR, et sollicite d'autres suggestions.

research academic conferences Information Retrieval AI Research

ARTICLEDEV.to AI·20/04/2026

Why RAG Breaks in Real-World Systems (and How I’m Trying to Fix It)

Les configurations RAG traditionnelles échouent dans les systèmes réels car elles traitent les documents récupérés comme des blocs isolés, ne parvenant pas à saisir les chaînes de relations cruciales entre eux. Cela empêche les modèles de structurer des réponses complexes, même lorsque des informations individuelles sont techniquement pertinentes.

System design AI models RAG Information Retrieval

ARTICLEDEV.to AI·il y a 18j

📚 The Book Pattern: Progressive Disclosure for AI Agents

Cet article présente le 'Modèle du Livre' et la 'divulgation progressive' comme un modèle mental pour la manière dont les agents d'IA devraient consommer l'information. Il suggère que les agents devraient s'engager progressivement avec les détails du projet, en commençant par des aperçus et en approfondissant uniquement si nécessaire, mimant le comportement humain avec les livres.

Mental Model Progressive Disclosure Architecture Information Retrieval

RESEARCHarXiv CS.CL·il y a 21j

Retrieval-Based Multi-Label Legal Annotation: Extensible, Data-Efficient and Hallucination-Free

L'article propose d'aborder l'annotation juridique multi-étiquettes comme une tâche de récupération, en utilisant des modèles figés et des k-plus proches voisins pour attribuer les étiquettes. Cette méthode atteint une précision compétitive et une forte efficacité des données sur des ensembles de données juridiques, réduisant considérablement les coûts de calcul par rapport au réglage fin des grands modèles linguistiques.

Multi-label Classification LLMs Legal AI Data efficiency

ARTICLEDEV.to AI·il y a 6j

How PageIndex Rethinks RAG Without Vector Search

PageIndex propose une approche alternative au RAG, en supprimant la dépendance aux embeddings vectoriels et à la recherche par similarité. Il vise à récupérer des informations précises via une navigation structurée, résolvant le problème de l'imprécision des systèmes RAG traditionnels.

AI architecture RAG vector search Information Retrieval

ARTICLEDEV.to AI·il y a 22j

GraphRAG vs vector RAG: when the knowledge graph pays for itself

Le contenu compare GraphRAG et Vector RAG, soulignant les limites de Vector RAG pour l'analyse holistique de corpus et la capacité de GraphRAG à y remédier grâce à des graphes de connaissances extraits par LLM et des résumés hiérarchiques. Il discute également du coût d'indexation considérablement plus élevé de GraphRAG et quand cet investissement est justifié.

Knowledge Graphs RAG Vector Embeddings Information Retrieval

ARTICLEDEV.to AI·09/04/2026

Building a Multi-Agent Research System with LangGraph: How I Taught Three AI Agents to Collaborate

O autor desenvolveu um sistema de IA multi-agente, o multi-agent-researcher, usando LangGraph, FAISS e Ollama, para recuperar e sintetizar informações de documentos internos e da web. Este artigo detalha a arquitetura, decisões de design e lições aprendidas na criação de agentes de IA colaborativos.

Open Source LangGraph multi-agent systems Information Retrieval

DOCDEV.to AI·22/04/2026

RAG Systems in Production: Building Enterprise Knowledge Search

Les systèmes de Génération Augmentée par Récupération (RAG) sont présentés comme une approche révolutionnaire permettant aux entreprises de créer des systèmes de connaissance intelligents en combinant les LLMs avec des connaissances spécifiques au domaine. Ce guide, basé sur l'expérience de Groovy Web avec des entreprises Fortune 500, couvre le processus complet de construction et de déploiement de systèmes RAG prêts pour la production, de l'architecture à la surveillance.

LLMs RAG knowledge management Enterprise AI

RESEARCHDEV.to AI·21/04/2026

Improving Video-Text Retrieval by Multi-Stream Corpus Alignment and Dual SoftmaxLoss

Cette recherche propose une méthode innovante pour améliorer la récupération vidéo-texte en intégrant l'alignement de corpus multi-flux. Elle introduit également une fonction Dual SoftmaxLoss pour optimiser davantage la précision et l'efficacité de la correspondance entre le contenu vidéo et les descriptions textuelles.

machine learning computer vision natural language processing Information Retrieval

ARTICLEDEV.to AI·22/04/2026

RAG: How AI Models Use Your Data Without Forgetting

Les grands modèles linguistiques sont intrinsèquement sans état, sans mémoire des conversations passées ni accès aux données à jour ou privées. Le RAG (Retrieval Augmented Generation) résout ce problème en introduisant une étape de récupération, permettant aux modèles d'accéder à des informations externes et de raisonner sur ces données.

LLMs RAG AI Information Retrieval

ARTICLEDEV.to AI·08/05/2026

Stop Rereading Your Documents. Let the AI Study Them Once.

Ce contenu met en évidence l'inefficacité des flux de travail RAG naïfs qui resynthétisent à plusieurs reprises les réponses pour des connaissances statiques, entraînant des coûts et des incohérences. Il propose de compiler les connaissances au moment de l'ingestion, un modèle suggéré par Andrej Karpathy (llm-wiki.md), où un LLM lit un document une fois pour construire des pages wiki structurées. Zenii implémente ce modèle optimisé directement.

RAG AI workflow knowledge management Information Retrieval

ARTICLEDEV.to AI·04/05/2026

Why Your Vector Index Returns Five Copies of the Same Doc

Le contenu décrit un mode de défaillance courant dans les systèmes RAG où l'index vectoriel renvoie plusieurs copies du même fragment de document, remplissant la fenêtre de contexte du LLM de redondance. Cela empêche le LLM d'accéder à des informations diverses et de fournir des réponses nuancées; la solution implique la déduplication par hachage avant le classement et le MMR.

RAG vector search AI Information Retrieval

DOCDEV.to AI·il y a 16j

RAG 시스템 실전 구축 (v18)

Ce document détaille la mise en œuvre pratique des systèmes RAG (Retrieval-Augmented Generation), expliquant leurs concepts fondamentaux et leur boucle de fonctionnement. Il couvre les étapes de récupération, d'augmentation et de génération de contexte pour améliorer les réponses des LLM, y compris le découpage sémantique de documents.

RAG NLP Information Retrieval Generative AI

RESEARCHDEV.to AI·il y a 7j

GrepSeek Trains a Search Agent to Use Shell Commands: GRPO-Trained Shell-Command Search

GrepSeek est une méthode pour entraîner un agent de recherche à utiliser des commandes shell comme grep au lieu d'indices vectoriels. Il apprend une politique pour rechercher directement des fichiers texte bruts, obtenant de solides performances sur les benchmarks QA sans indexation préalable.

Shell Commands machine learning Search Agents AI

ARTICLEDEV.to AI·il y a 9j

Start Here: My AI Memory Research So Far

L'auteur décrit son parcours de recherche sur la mémoire de l'IA, détaillant quatre étapes de découvertes concernant le fonctionnement et les défis de ces systèmes. Il explore la survie de la mémoire après les réinitialisations, l'importance de la mémoire de correction, la relation entre la précision de récupération et la sécurité, et la distinction cruciale entre pertinence et autorité dans la mémoire de l'IA.

Memory Systems Information Retrieval AI Research AI agents

RESEARCHDEV.to AI·21/04/2026

A Few Brief Notes on DeepImpact, COIL, and a Conceptual Framework forInformation Retrieval Techniques

Ce contenu propose de brèves notes sur DeepImpact et COIL, deux techniques de récupération d'informations. Il introduit également un cadre conceptuel pour comprendre et appliquer ces méthodes et d'autres méthodes connexes.

AI models frameworks DeepImpact Information Retrieval

DOCDEV.to AI·26/04/2026

What 40 Channels Means in AutoSearch

Le texte explique que "40 canaux" dans AutoSearch signifie un accès à la recherche spécifique à la source à travers divers écosystèmes tels que le web, l'académique, le développeur, le social et la vidéo. Chaque canal représente une famille de sources distinctes, permettant aux agents et aux humains d'effectuer des recherches plus précises et de mieux juger les résultats.

search AI data sources Information Retrieval

ARTICLEDeepLearning.AI (YouTube)·il y a 18j

Semantic Search Starts With Embeddings

Ce contenu explore le concept de recherche sémantique, soulignant qu'elle commence par l'utilisation d'embeddings. Il aborde les fondements techniques de la récupération d'informations basée sur le sens.

natural language processing semantic search embeddings AI