← heapsort-ai

Information Retrieval

36 items

RESEARCHarXiv CS.CL·il y a 20h

Bidirectional Small-Granularity Search between Code and Text

Cette recherche introduit une nouvelle tâche de recherche bidirectionnelle à petite granularité entre code et texte, visant à lier les publications scientifiques aux segments de code correspondants. Elle propose un grand ensemble de données, partiellement généré par GPT-4, et une approche modulaire qui obtient de bons résultats.

54
ARTICLE↑ trendingHacker News (AI)·il y a 7j

RSS is back. AI agents are reading it

Le RSS connaît un regain d'intérêt en tant que moyen efficace pour les agents d'IA de consommer du contenu web, offrant un flux d'informations structuré et à jour. Cela permet aux modèles d'IA d'accéder et de traiter de grands volumes de données plus efficacement, marquant un nouveau chapitre pour cette technologie autrefois considérée comme obsolète.

42
ARTICLEDEV.to AI·20/04/2026

Why RAG Breaks in Real-World Systems (and How I’m Trying to Fix It)

Les configurations RAG traditionnelles échouent dans les systèmes réels car elles traitent les documents récupérés comme des blocs isolés, ne parvenant pas à saisir les chaînes de relations cruciales entre eux. Cela empêche les modèles de structurer des réponses complexes, même lorsque des informations individuelles sont techniquement pertinentes.

35
ARTICLEDEV.to AI·il y a 18j

📚 The Book Pattern: Progressive Disclosure for AI Agents

Cet article présente le 'Modèle du Livre' et la 'divulgation progressive' comme un modèle mental pour la manière dont les agents d'IA devraient consommer l'information. Il suggère que les agents devraient s'engager progressivement avec les détails du projet, en commençant par des aperçus et en approfondissant uniquement si nécessaire, mimant le comportement humain avec les livres.

34
RESEARCHarXiv CS.CL·il y a 21j

Retrieval-Based Multi-Label Legal Annotation: Extensible, Data-Efficient and Hallucination-Free

L'article propose d'aborder l'annotation juridique multi-étiquettes comme une tâche de récupération, en utilisant des modèles figés et des k-plus proches voisins pour attribuer les étiquettes. Cette méthode atteint une précision compétitive et une forte efficacité des données sur des ensembles de données juridiques, réduisant considérablement les coûts de calcul par rapport au réglage fin des grands modèles linguistiques.

29
ARTICLEDEV.to AI·il y a 22j

GraphRAG vs vector RAG: when the knowledge graph pays for itself

Le contenu compare GraphRAG et Vector RAG, soulignant les limites de Vector RAG pour l'analyse holistique de corpus et la capacité de GraphRAG à y remédier grâce à des graphes de connaissances extraits par LLM et des résumés hiérarchiques. Il discute également du coût d'indexation considérablement plus élevé de GraphRAG et quand cet investissement est justifié.

28
DOCDEV.to AI·22/04/2026

RAG Systems in Production: Building Enterprise Knowledge Search

Les systèmes de Génération Augmentée par Récupération (RAG) sont présentés comme une approche révolutionnaire permettant aux entreprises de créer des systèmes de connaissance intelligents en combinant les LLMs avec des connaissances spécifiques au domaine. Ce guide, basé sur l'expérience de Groovy Web avec des entreprises Fortune 500, couvre le processus complet de construction et de déploiement de systèmes RAG prêts pour la production, de l'architecture à la surveillance.

28
RESEARCHDEV.to AI·21/04/2026

Improving Video-Text Retrieval by Multi-Stream Corpus Alignment and Dual SoftmaxLoss

Cette recherche propose une méthode innovante pour améliorer la récupération vidéo-texte en intégrant l'alignement de corpus multi-flux. Elle introduit également une fonction Dual SoftmaxLoss pour optimiser davantage la précision et l'efficacité de la correspondance entre le contenu vidéo et les descriptions textuelles.

27
ARTICLEDEV.to AI·22/04/2026

RAG: How AI Models Use Your Data Without Forgetting

Les grands modèles linguistiques sont intrinsèquement sans état, sans mémoire des conversations passées ni accès aux données à jour ou privées. Le RAG (Retrieval Augmented Generation) résout ce problème en introduisant une étape de récupération, permettant aux modèles d'accéder à des informations externes et de raisonner sur ces données.

27
ARTICLEDEV.to AI·08/05/2026

Stop Rereading Your Documents. Let the AI Study Them Once.

Ce contenu met en évidence l'inefficacité des flux de travail RAG naïfs qui resynthétisent à plusieurs reprises les réponses pour des connaissances statiques, entraînant des coûts et des incohérences. Il propose de compiler les connaissances au moment de l'ingestion, un modèle suggéré par Andrej Karpathy (llm-wiki.md), où un LLM lit un document une fois pour construire des pages wiki structurées. Zenii implémente ce modèle optimisé directement.

27
ARTICLEDEV.to AI·04/05/2026

Why Your Vector Index Returns Five Copies of the Same Doc

Le contenu décrit un mode de défaillance courant dans les systèmes RAG où l'index vectoriel renvoie plusieurs copies du même fragment de document, remplissant la fenêtre de contexte du LLM de redondance. Cela empêche le LLM d'accéder à des informations diverses et de fournir des réponses nuancées; la solution implique la déduplication par hachage avant le classement et le MMR.

27
DOCDEV.to AI·il y a 16j

RAG 시스템 실전 구축 (v18)

Ce document détaille la mise en œuvre pratique des systèmes RAG (Retrieval-Augmented Generation), expliquant leurs concepts fondamentaux et leur boucle de fonctionnement. Il couvre les étapes de récupération, d'augmentation et de génération de contexte pour améliorer les réponses des LLM, y compris le découpage sémantique de documents.

27
ARTICLEDEV.to AI·il y a 9j

Start Here: My AI Memory Research So Far

L'auteur décrit son parcours de recherche sur la mémoire de l'IA, détaillant quatre étapes de découvertes concernant le fonctionnement et les défis de ces systèmes. Il explore la survie de la mémoire après les réinitialisations, l'importance de la mémoire de correction, la relation entre la précision de récupération et la sécurité, et la distinction cruciale entre pertinence et autorité dans la mémoire de l'IA.

27
DOCDEV.to AI·26/04/2026

What 40 Channels Means in AutoSearch

Le texte explique que "40 canaux" dans AutoSearch signifie un accès à la recherche spécifique à la source à travers divers écosystèmes tels que le web, l'académique, le développeur, le social et la vidéo. Chaque canal représente une famille de sources distinctes, permettant aux agents et aux humains d'effectuer des recherches plus précises et de mieux juger les résultats.

27