← heapsort-ai

Information Retrieval

36 items

ARTICLEDEV.to AI·5/3/2026

How Pulse matches you with the right provider — semantic AI search vs keyword lookup. BizNode Pulse uses embedding-based...

BizNode Pulse nutzt die auf Embeddings basierende semantische KI-Suche, um Benutzer mit den passenden Anbietern zu verbinden und bietet eine überlegene Alternative zur Stichwortsuche. Dieser Ansatz verbessert die Relevanz und Präzision der Suchergebnisse, indem er den Kontext und die Bedeutung von Anfragen versteht.

27
RESEARCHarXiv CS.AI·4/27/2026

Memanto: Typed Semantic Memory with Information-Theoretic Retrieval for Long-Horizon Agents

Memanto stellt eine universelle Speicherschicht für autonome KI-Agenten vor, die den architektonischen Engpass des Speichers in persistenten Multi-Session-Systemen adressiert. Es stellt die Notwendigkeit komplexer Wissensgraphen in Frage, indem es ein einfacheres getyptes semantisches Speicherschema mit automatischer Konfliktlösung und temporaler Versionierung vorschlägt.

27
RESEARCHarXiv CS.CL·4/8/2026

Document Optimization for Black-Box Retrieval via Reinforcement Learning

Este artigo de pesquisa propõe uma nova abordagem para otimização de documentos, transformando-os para melhor alinhamento com sistemas de recuperação via Reinforcement Learning (GRPO), utilizando melhorias de ranking como recompensa. O método, aplicável a retrievers de caixa preta, demonstrou ganhos em tarefas de recuperação de código e documentos visuais.

27
RESEARCHarXiv CS.CL·5/8/2026

Generating Query-Focused Summarization Datasets from Query-Free Summarization Datasets

Dieses Papier schlägt ein evidenzbasiertes Modell vor, um Abfragen aus abfragefreien Zusammenfassungsdatensätzen zu generieren und so die Herausforderung geeigneter Datensätze für die abfragefokussierte Zusammenfassung (QFS) anzugehen. Experimente zeigen, dass Zusammenfassungen, die mit diesen evidenzbasierten Abfragen generiert wurden, wettbewerbsfähige ROUGE-Werte erreichen, was ihre Wirksamkeit für die QFS-Aufgabe unterstützt.

27
RESEARCHarXiv CS.AI·vor 24T

PolitNuggets: Benchmarking Agentic Discovery of Long-Tail Political Facts

Dieses Papier stellt PolitNuggets vor, einen mehrsprachigen Benchmark für die agentische Informationssynthese, der sich auf die Erstellung politischer Biografien für 400 globale Eliten konzentriert. Es bewertet große Schlussfolgerungsmodelle bei der Entdeckung und Synthese von "Long-Tail"-Politikfakten und zeigt Herausforderungen bei feinen Details und der Effizienz auf.

27
RESEARCHarXiv CS.CL·vor 29T

Can LLMs Take Retrieved Information with a Grain of Salt?

Dieser Artikel bewertet die Fähigkeit großer Sprachmodelle (LLMs), ihre Antworten an die Sicherheit der abgerufenen Informationen anzupassen, und deckt systematische Einschränkungen auf. Er schlägt eine Interaktionsstrategie vor, die frühere Erinnerungen, Sicherheitsskalibrierung und Kontextvereinfachung kombiniert, um die Zuverlässigkeit von LLMs zu verbessern. Dieser Ansatz reduziert Gehorsamsfehler um 25%, ohne Modellgewichte zu ändern.

27
RESEARCHarXiv CS.CL·vor 29T

Group of Skills: Group-Structured Skill Retrieval for Agent Skill Libraries

Dieses Papier stellt Group of Skills (GoSkills) vor, eine inferenzzeitliche gruppenstrukturierte Abrufmethode für Agenten-Skill-Bibliotheken. Es wandelt flache Skill-Listen in kompakte, rollenbeschriftete Ausführungskontexte um, indem es ankerzentrierte Skill-Gruppen aufbaut und einen festen Ausführungsvertrag mit Start-, Support-, Check- und Avoid-Feldern rendert.

27
RESEARCHarXiv CS.CL·vor 15T

Query-Adaptive Semantic Chunking for Retrieval-Augmented Generation: A Dynamic Strategy with Contextual Window Expansion

Dieser Artikel stellt Query-Adaptive Semantic Chunking (QASC) vor, eine dynamische Strategie für Retrieval-Augmented Generation (RAG)-Systeme, die Benutzeranfragen in die Dokumentsegmentierung integriert. QASC nutzt Kosinus-Ähnlichkeitsbewertung, kontextuelle Fenstererweiterung und Chunk-Level-Score-Aggregation, um die Kontextabfrage zu optimieren und die Einschränkungen fester Chunking-Methoden zu überwinden.

27
ARTICLEHugging Face Blog·vor 22T

Introducing the Ettin Reranker Family

Dieser Artikel stellt die Ettin Reranker Familie vor, eine neue Modellreihe, die entwickelt wurde, um die Relevanz und Qualität von Ergebnissen in Such- und Empfehlungssystemen zu verbessern. Die Ettin-Modelle zielen darauf ab, die Dokumentenreihung zu optimieren und eine verbesserte Leistung bei Informationsabrufaufgaben zu bieten.

27
ARTICLEDEV.to AI·4/26/2026

Bilibili Tech Video Search Through MCP

Dieser Inhalt erklärt, wie KI-Agenten Bilibili über AutoSearch in technische Forschungsabläufe integrieren können, um dessen einzigartigen Videoinhalt für Themen wie Demos und UI-Verhalten zu nutzen. Er hebt den Wert von Bilibili hervor, traditionelle textbasierte Quellen zu ergänzen, insbesondere für den Zugang zu Einblicken von chinesischen Entwicklergemeinschaften.

21
ARTICLEOpenAI Blog·4/10/2026

Research with ChatGPT

Dieser Inhalt lehrt Nutzer, wie man effektiv mit ChatGPT recherchiert, unter Einsatz von Such- und Tiefenrecherchetechniken. Er behandelt das Finden aktueller Informationen, die Analyse von Quellen und die Generierung strukturierter Erkenntnisse.

21