← heapsort-ai

Information Retrieval

36 items

ARTICLEDEV.to AI·03/05/2026

How Pulse matches you with the right provider — semantic AI search vs keyword lookup. BizNode Pulse uses embedding-based...

BizNode Pulse utilise la recherche sémantique IA basée sur des embeddings pour mettre en relation les utilisateurs avec les bons fournisseurs, offrant une alternative supérieure à la recherche par mots-clés. Cette approche améliore la pertinence et la précision des résultats de recherche en comprenant le contexte et la signification des requêtes.

27
RESEARCHarXiv CS.AI·27/04/2026

Memanto: Typed Semantic Memory with Information-Theoretic Retrieval for Long-Horizon Agents

Memanto introduit une couche de mémoire universelle pour les agents d'IA autonomes, s'attaquant au goulot d'étranglement architectural de la mémoire dans les systèmes persistants multi-sessions. Il remet en question la nécessité de graphes de connaissances complexes en proposant un schéma de mémoire sémantique typée plus simple avec résolution de conflits automatisée et versionnement temporel.

27
RESEARCHarXiv CS.CL·08/04/2026

Document Optimization for Black-Box Retrieval via Reinforcement Learning

Este artigo de pesquisa propõe uma nova abordagem para otimização de documentos, transformando-os para melhor alinhamento com sistemas de recuperação via Reinforcement Learning (GRPO), utilizando melhorias de ranking como recompensa. O método, aplicável a retrievers de caixa preta, demonstrou ganhos em tarefas de recuperação de código e documentos visuais.

27
RESEARCHarXiv CS.CL·08/05/2026

Generating Query-Focused Summarization Datasets from Query-Free Summarization Datasets

Ce document propose un modèle basé sur des preuves pour générer des requêtes à partir d'ensembles de données de résumé sans requête, répondant au défi de trouver des ensembles de données adaptés pour la synthèse axée sur les requêtes (QFS). Les expériences montrent que les résumés générés à l'aide de ces requêtes basées sur des preuves obtiennent des scores ROUGE compétitifs, soutenant leur efficacité pour la tâche de QFS.

27
RESEARCHarXiv CS.AI·il y a 24j

PolitNuggets: Benchmarking Agentic Discovery of Long-Tail Political Facts

Cet article introduit PolitNuggets, un benchmark multilingue pour la synthèse d'informations agêntiques, axé sur la construction de biographies politiques pour 400 élites mondiales. Il évalue les grands modèles de raisonnement dans la découverte et la synthèse de faits politiques de "longue traîne", soulignant les défis liés aux détails précis et à l'efficacité.

27
RESEARCHarXiv CS.CL·il y a 29j

Can LLMs Take Retrieved Information with a Grain of Salt?

Cet article évalue la capacité des grands modèles de langage (LLM) à adapter leurs réponses à la certitude des informations récupérées, révélant des limitations systématiques. Il propose une stratégie d'interaction combinant des rappels préalables, une recalibration de la certitude et une simplification du contexte pour améliorer la fiabilité des LLM. Cette approche réduit les erreurs d'obéissance de 25% sans modifier les poids du modèle.

27
RESEARCHarXiv CS.CL·il y a 29j

Group of Skills: Group-Structured Skill Retrieval for Agent Skill Libraries

Cet article introduit Group of Skills (GoSkills), une méthode de récupération de compétences structurées en groupe pour les bibliothèques de compétences d'agents IA. Il transforme les listes de compétences plates en contextes d'exécution compacts et étiquetés par rôle, en construisant des groupes de compétences centrés sur des ancres et en rendant un contrat d'exécution fixe avec des champs Démarrer, Soutenir et Vérifier.

27
RESEARCHarXiv CS.CL·il y a 15j

Query-Adaptive Semantic Chunking for Retrieval-Augmented Generation: A Dynamic Strategy with Contextual Window Expansion

Cet article présente le Query-Adaptive Semantic Chunking (QASC), une stratégie dynamique pour les systèmes de Génération Augmentée par Récupération (RAG) qui intègre les requêtes de l'utilisateur dans la segmentation des documents. Le QASC utilise la notation de similarité cosinus, l'expansion de fenêtre contextuelle et l'agrégation de scores au niveau du chunk pour optimiser la récupération de contexte, palliant les limites des méthodes de chunking fixes.

27
ARTICLEHugging Face Blog·il y a 22j

Introducing the Ettin Reranker Family

Cet article présente la famille de rerankers Ettin, un nouvel ensemble de modèles conçus pour améliorer la pertinence et la qualité des résultats dans les systèmes de recherche et de recommandation. Les modèles Ettin visent à optimiser le classement des documents, offrant de meilleures performances dans les tâches de récupération d'informations.

27
ARTICLEDEV.to AI·26/04/2026

Bilibili Tech Video Search Through MCP

Ce contenu explique comment les agents d'IA peuvent intégrer Bilibili dans des flux de travail de recherche technique via AutoSearch, exploitant son contenu vidéo unique pour des sujets tels que les démonstrations et les comportements d'interface utilisateur. Il souligne la valeur de Bilibili pour compléter les sources textuelles traditionnelles, en particulier pour accéder aux informations des communautés de développeurs chinois.

21
ARTICLEDEV.to AI·26/04/2026

Zhihu Deep Knowledge Search for Agents

Zhihu est analysé comme une source précieuse pour les agents d'IA en recherche approfondie en chinois, offrant des explications et un contexte détaillés. Les flux de travail des agents doivent tenir compte de sa qualité variable, en exploitant ses atouts pour le raisonnement à long terme.

21
ARTICLEOpenAI Blog·10/04/2026

Research with ChatGPT

Ce contenu explique comment effectuer des recherches efficaces avec ChatGPT, en utilisant la recherche simple et la recherche approfondie. Il couvre la recherche d'informations à jour, l'analyse des sources et la génération d'insights structurés.

21
ARTICLEDEV.to AI·il y a 4j

Graph-Based vs Traditional Enterprise Search: Pros and Cons

Cet article compare les méthodes de recherche d'entreprise traditionnelles et basées sur les graphes, en détaillant leurs avantages et inconvénients. La recherche traditionnelle se fonde sur la correspondance de mots-clés, tandis que la recherche basée sur les graphes utilise un traitement orienté relations pour un contexte et une évolutivité améliorés.

19