Information Retrieval

36 items

ARTICLEDEV.to AI·03/05/2026

How Pulse matches you with the right provider — semantic AI search vs keyword lookup. BizNode Pulse uses embedding-based...

BizNode Pulse utilise la recherche sémantique IA basée sur des embeddings pour mettre en relation les utilisateurs avec les bons fournisseurs, offrant une alternative supérieure à la recherche par mots-clés. Cette approche améliore la pertinence et la précision des résultats de recherche en comprenant le contexte et la signification des requêtes.

provider matching semantic search embeddings AI

RESEARCHarXiv CS.AI·27/04/2026

Memanto: Typed Semantic Memory with Information-Theoretic Retrieval for Long-Horizon Agents

Memanto introduit une couche de mémoire universelle pour les agents d'IA autonomes, s'attaquant au goulot d'étranglement architectural de la mémoire dans les systèmes persistants multi-sessions. Il remet en question la nécessité de graphes de connaissances complexes en proposant un schéma de mémoire sémantique typée plus simple avec résolution de conflits automatisée et versionnement temporel.

Knowledge Graphs Semantic Memory memory management Information Retrieval

RESEARCHDEV.to AI·08/04/2026

Neural Models for Information Retrieval

Este conteúdo aborda o uso de modelos neurais para aprimorar os sistemas de recuperação de informação. Explora como a inteligência artificial pode otimizar a busca e organização de grandes volumes de dados.

neural networks deep learning machine learning Information Retrieval

RESEARCHarXiv CS.CL·08/04/2026

Document Optimization for Black-Box Retrieval via Reinforcement Learning

Este artigo de pesquisa propõe uma nova abordagem para otimização de documentos, transformando-os para melhor alinhamento com sistemas de recuperação via Reinforcement Learning (GRPO), utilizando melhorias de ranking como recompensa. O método, aplicável a retrievers de caixa preta, demonstrou ganhos em tarefas de recuperação de código e documentos visuais.

language models Vision-Language Models reinforcement learning document optimization

RESEARCHarXiv CS.CL·08/05/2026

Generating Query-Focused Summarization Datasets from Query-Free Summarization Datasets

Ce document propose un modèle basé sur des preuves pour générer des requêtes à partir d'ensembles de données de résumé sans requête, répondant au défi de trouver des ensembles de données adaptés pour la synthèse axée sur les requêtes (QFS). Les expériences montrent que les résumés générés à l'aide de ces requêtes basées sur des preuves obtiennent des scores ROUGE compétitifs, soutenant leur efficacité pour la tâche de QFS.

query generation Natural Language Processing datasets summarization

RESEARCHarXiv CS.AI·il y a 24j

PolitNuggets: Benchmarking Agentic Discovery of Long-Tail Political Facts

Cet article introduit PolitNuggets, un benchmark multilingue pour la synthèse d'informations agêntiques, axé sur la construction de biographies politiques pour 400 élites mondiales. Il évalue les grands modèles de raisonnement dans la découverte et la synthèse de faits politiques de "longue traîne", soulignant les défis liés aux détails précis et à l'efficacité.

political facts Benchmarking Information Retrieval AI agents

RESEARCHarXiv CS.CL·il y a 29j

Can LLMs Take Retrieved Information with a Grain of Salt?

Cet article évalue la capacité des grands modèles de langage (LLM) à adapter leurs réponses à la certitude des informations récupérées, révélant des limitations systématiques. Il propose une stratégie d'interaction combinant des rappels préalables, une recalibration de la certitude et une simplification du contexte pour améliorer la fiabilité des LLM. Cette approche réduit les erreurs d'obéissance de 25% sans modifier les poids du modèle.

LLMs context certainty Natural Language Processing AI reliability

RESEARCHarXiv CS.CL·il y a 29j

Group of Skills: Group-Structured Skill Retrieval for Agent Skill Libraries

Cet article introduit Group of Skills (GoSkills), une méthode de récupération de compétences structurées en groupe pour les bibliothèques de compétences d'agents IA. Il transforme les listes de compétences plates en contextes d'exécution compacts et étiquetés par rôle, en construisant des groupes de compétences centrés sur des ancres et en rendant un contrat d'exécution fixe avec des champs Démarrer, Soutenir et Vérifier.

Skill Retrieval machine learning Information Retrieval AI agents

RESEARCHarXiv CS.CL·il y a 15j

Query-Adaptive Semantic Chunking for Retrieval-Augmented Generation: A Dynamic Strategy with Contextual Window Expansion

Cet article présente le Query-Adaptive Semantic Chunking (QASC), une stratégie dynamique pour les systèmes de Génération Augmentée par Récupération (RAG) qui intègre les requêtes de l'utilisateur dans la segmentation des documents. Le QASC utilise la notation de similarité cosinus, l'expansion de fenêtre contextuelle et l'agrégation de scores au niveau du chunk pour optimiser la récupération de contexte, palliant les limites des méthodes de chunking fixes.

RAG Natural Language Processing Information Retrieval Semantic Chunking

ARTICLEHugging Face Blog·il y a 22j

Introducing the Ettin Reranker Family

Cet article présente la famille de rerankers Ettin, un nouvel ensemble de modèles conçus pour améliorer la pertinence et la qualité des résultats dans les systèmes de recherche et de recommandation. Les modèles Ettin visent à optimiser le classement des documents, offrant de meilleures performances dans les tâches de récupération d'informations.

AI models machine learning Reranking Information Retrieval

ARTICLEYannic Kilcher (YouTube)·11/10/2025

[Paper Analysis] On the Theoretical Limitations of Embedding-Based Retrieval (Warning: Rant)

Cet article analyse les limitations théoriques des systèmes de récupération basés sur les embeddings. L'auteur exprime une perspective critique sur le sujet.

machine learning embeddings AI theoretical limitations

[Paper Analysis] On the Theoretical Limitations of Embedding-Based Retrieval (Warning: Rant)

ARTICLEDEV.to AI·26/04/2026

Tagging, Folksonomy & Co - Renaissance of Manual Indexing?

Cet article explore les concepts de marquage, de folksonomie et d'indexation manuelle, se demandant s'il y a une importance renouvelée pour les méthodes de classification de données dirigées par l'homme. Il discute probablement de leur rôle à une époque de plus en plus dominée par l'IA et l'organisation automatisée du contenu.

Data Organization manual-indexing Information Retrieval folksonomy

ARTICLEDEV.to AI·26/04/2026

Bilibili Tech Video Search Through MCP

Ce contenu explique comment les agents d'IA peuvent intégrer Bilibili dans des flux de travail de recherche technique via AutoSearch, exploitant son contenu vidéo unique pour des sujets tels que les démonstrations et les comportements d'interface utilisateur. Il souligne la valeur de Bilibili pour compléter les sources textuelles traditionnelles, en particulier pour accéder aux informations des communautés de développeurs chinois.

video content Chinese tech Information Retrieval technical research

ARTICLEDEV.to AI·26/04/2026

Zhihu Deep Knowledge Search for Agents

Zhihu est analysé comme une source précieuse pour les agents d'IA en recherche approfondie en chinois, offrant des explications et un contexte détaillés. Les flux de travail des agents doivent tenir compte de sa qualité variable, en exploitant ses atouts pour le raisonnement à long terme.

LLMs research Information Retrieval AI agents

ARTICLEOpenAI Blog·10/04/2026

Research with ChatGPT

Ce contenu explique comment effectuer des recherches efficaces avec ChatGPT, en utilisant la recherche simple et la recherche approfondie. Il couvre la recherche d'informations à jour, l'analyse des sources et la génération d'insights structurés.

research ChatGPT data analysis AI tools

ARTICLEDEV.to AI·il y a 4j

Graph-Based vs Traditional Enterprise Search: Pros and Cons

Cet article compare les méthodes de recherche d'entreprise traditionnelles et basées sur les graphes, en détaillant leurs avantages et inconvénients. La recherche traditionnelle se fonde sur la correspondance de mots-clés, tandis que la recherche basée sur les graphes utilise un traitement orienté relations pour un contexte et une évolutivité améliorés.

graph technology data management Enterprise Search Information Retrieval