Information Retrieval

36 items

RESEARCHarXiv CS.CL·vor 20Std

Bidirectional Small-Granularity Search between Code and Text

Diese Forschung stellt eine neue Aufgabe vor: die bidirektionale Suche mit kleiner Granularität zwischen Code und Text, die wissenschaftliche Publikationen mit entsprechenden Codesegmenten verknüpfen soll. Sie schlägt einen großen Datensatz vor, teilweise generiert von GPT-4, und einen modularen Ansatz, der gute Ergebnisse erzielt.

machine learning natural language processing Code Analysis Information Retrieval

ARTICLE↑ trendingHacker News (AI)·vor 7T

RSS is back. AI agents are reading it

RSS erlebt ein Wiederaufleben als effektiver Weg für KI-Agenten, Webinhalte zu konsumieren, indem es einen strukturierten und aktuellen Informationsfeed bietet. Dies ermöglicht es KI-Modellen, große Datenmengen effizienter zu verarbeiten und darauf zuzugreifen, was ein neues Kapitel für diese ehemals als obsolet angesehene Technologie darstellt.

RSS news aggregation Information Retrieval AI agents

ARTICLE↑ trendingReddit r/MachineLearning·4/17/2026

SIGIR-AP: Good conference for IR? [D]

Ein studentischer Forscher, der sich für Information Retrieval (IR) interessiert, sucht Rat bezüglich weniger kompetitiver akademischer Konferenzen zur Einreichung. Er fragt insbesondere nach SIGIR-AP, einer neuen von SIGIR unterstützten Konferenz, und nach weiteren geeigneten Optionen.

research academic conferences Information Retrieval AI Research

ARTICLEDEV.to AI·4/20/2026

Why RAG Breaks in Real-World Systems (and How I’m Trying to Fix It)

Herkömmliche RAG-Setups scheitern in realen Systemen, da sie abgerufene Dokumente als isolierte Informationsstücke behandeln und die entscheidenden Beziehungsketten zwischen ihnen nicht erfassen. Dies hindert Modelle daran, komplexe Antworten zu strukturieren, selbst wenn einzelne Informationen technisch relevant sind.

System design AI models RAG Information Retrieval

ARTICLEDEV.to AI·vor 18T

📚 The Book Pattern: Progressive Disclosure for AI Agents

Dieser Artikel stellt das 'Buchmuster' und die 'progressive Offenlegung' als mentales Modell dafür vor, wie KI-Agenten Informationen konsumieren sollten. Er schlägt vor, dass Agenten schrittweise mit Projektdetails interagieren, beginnend mit Übersichten und nur bei Bedarf tiefer gehend, was das menschliche Verhalten beim Lesen von Büchern widerspiegelt.

Mental Model Progressive Disclosure Architecture Information Retrieval

RESEARCHarXiv CS.CL·vor 21T

Retrieval-Based Multi-Label Legal Annotation: Extensible, Data-Efficient and Hallucination-Free

Der Artikel schlägt vor, die mehrfache juristische Annotation als Abrufaufgabe zu betrachten, wobei eingefrorene Modelle und k-nächste Nachbarn zur Zuweisung von Labels verwendet werden. Diese Methode erzielt eine wettbewerbsfähige Genauigkeit und eine hohe Dateneffizienz auf juristischen Datensätzen, wodurch die Rechenkosten im Vergleich zum Fine-Tuning großer Sprachmodelle erheblich gesenkt werden.

Multi-label Classification LLMs Legal AI Data efficiency

ARTICLEDEV.to AI·vor 6T

How PageIndex Rethinks RAG Without Vector Search

PageIndex bietet einen alternativen Ansatz zu traditionellem RAG, der auf Vektor-Embeddings und Ähnlichkeitssuche verzichtet. Ziel ist es, genaue Informationen durch strukturierte Navigation abzurufen und die Ungenauigkeit herkömmlicher RAG-Systeme zu beheben.

AI architecture RAG vector search Information Retrieval

ARTICLEDEV.to AI·vor 22T

GraphRAG vs vector RAG: when the knowledge graph pays for itself

Dieser Inhalt vergleicht GraphRAG und Vector RAG, wobei die Einschränkungen von Vector RAG für die ganzheitliche Korpusanalyse hervorgehoben werden und wie GraphRAG diese Lücke durch LLM-extrahierte Wissensgraphen und hierarchische Zusammenfassungen schließt. Er erörtert auch die deutlich höheren Indexierungskosten von GraphRAG und wann dieser Aufwand gerechtfertigt ist.

Knowledge Graphs RAG Vector Embeddings Information Retrieval

ARTICLEDEV.to AI·4/9/2026

Building a Multi-Agent Research System with LangGraph: How I Taught Three AI Agents to Collaborate

O autor desenvolveu um sistema de IA multi-agente, o multi-agent-researcher, usando LangGraph, FAISS e Ollama, para recuperar e sintetizar informações de documentos internos e da web. Este artigo detalha a arquitetura, decisões de design e lições aprendidas na criação de agentes de IA colaborativos.

Open Source LangGraph multi-agent systems Information Retrieval

DOCDEV.to AI·4/22/2026

RAG Systems in Production: Building Enterprise Knowledge Search

Retrieval-Augmented Generation (RAG)-Systeme werden als revolutionärer Ansatz für Unternehmen vorgestellt, um intelligente Wissenssysteme aufzubauen, indem sie LLMs mit domänenspezifischem Wissen kombinieren. Dieser Leitfaden, basierend auf der Erfahrung von Groovy Web mit Fortune-500-Unternehmen, deckt den umfassenden Prozess des Aufbaus und der Bereitstellung produktionsreifer RAG-Systeme ab, von der Architektur bis zum Monitoring.

LLMs RAG knowledge management Enterprise AI

RESEARCHDEV.to AI·4/21/2026

Improving Video-Text Retrieval by Multi-Stream Corpus Alignment and Dual SoftmaxLoss

Diese Forschung schlägt eine neuartige Methode zur Verbesserung der Video-Text-Retrieval durch die Integration von Multi-Stream-Korpus-Ausrichtung vor. Sie führt auch eine Dual SoftmaxLoss-Funktion ein, um die Genauigkeit und Effizienz der Zuordnung von Videoinhalten zu Textbeschreibungen weiter zu verbessern.

machine learning computer vision natural language processing Information Retrieval

ARTICLEDEV.to AI·4/22/2026

RAG: How AI Models Use Your Data Without Forgetting

Große Sprachmodelle sind zustandslos und haben keine Erinnerung an frühere Gespräche oder Zugriff auf aktuelle oder private Daten. RAG (Retrieval Augmented Generation) behebt dies durch die Einführung eines Abrufschritts, der es Modellen ermöglicht, auf externe Informationen zuzugreifen und als Denkmaschine über diese Daten zu fungieren.

LLMs RAG AI Information Retrieval

ARTICLEDEV.to AI·5/8/2026

Stop Rereading Your Documents. Let the AI Study Them Once.

Dieser Inhalt beleuchtet die Ineffizienz naiver RAG-Workflows, die Antworten für statisches Wissen wiederholt neu synthetisieren, was Kosten und Inkonsistenzen verursacht. Es wird vorgeschlagen, Wissen zum Zeitpunkt der Aufnahme zu kompilieren, ein Muster, das von Andrej Karpathy (llm-wiki.md) vorgeschlagen wurde, bei dem ein LLM ein Dokument einmal liest, um strukturierte Wiki-Seiten zu erstellen. Zenii implementiert dieses optimierte Muster standardmäßig.

RAG AI workflow knowledge management Information Retrieval

ARTICLEDEV.to AI·5/4/2026

Why Your Vector Index Returns Five Copies of the Same Doc

Der Inhalt beschreibt einen häufigen Fehler in RAG-Systemen, bei dem der Vektorindex mehrere Kopien desselben Dokumenten-Chunks zurückgibt und das Kontextfenster des LLM mit Redundanz füllt. Dies verhindert, dass das LLM auf vielfältige Informationen zugreifen und nuancierte Antworten geben kann; die Lösung umfasst Hash-Deduplizierung vor dem Ranking und MMR.

RAG vector search AI Information Retrieval

DOCDEV.to AI·vor 16T

RAG 시스템 실전 구축 (v18)

Dieses Dokument beschreibt die praktische Implementierung von RAG-Systemen (Retrieval-Augmented Generation) und erläutert deren Kernkonzepte und Funktionsweise. Es behandelt die Phasen der Abrufung, Erweiterung und Generierung von Kontext zur Verbesserung von LLM-Antworten, einschließlich semantischer Dokumentenfragmentierung.

RAG NLP Information Retrieval Generative AI

RESEARCHDEV.to AI·vor 7T

GrepSeek Trains a Search Agent to Use Shell Commands: GRPO-Trained Shell-Command Search

GrepSeek ist eine Methode, um einen Suchagenten darauf zu trainieren, Shell-Befehle wie grep anstelle von Vektorindizes zu verwenden. Er lernt eine Strategie, Roh-Textdateien direkt zu durchsuchen und erreicht eine starke Leistung bei QA-Benchmarks ohne vorherige Indexierung.

Shell Commands machine learning Search Agents AI

ARTICLEDEV.to AI·vor 9T

Start Here: My AI Memory Research So Far

Der Autor beschreibt seine Forschungsreise im Bereich des KI-Speichers und detailliert vier Entdeckungsphasen über die Funktionsweise und Herausforderungen dieser Systeme. Er untersucht das Überleben des Speichers nach Resets, die Bedeutung des Korrekturspeichers, die Beziehung zwischen Abrufgenauigkeit und Sicherheit sowie den entscheidenden Unterschied zwischen Relevanz und Autorität im KI-Speicher.

Memory Systems Information Retrieval AI Research AI agents

RESEARCHDEV.to AI·4/21/2026

A Few Brief Notes on DeepImpact, COIL, and a Conceptual Framework forInformation Retrieval Techniques

Dieser Inhalt bietet kurze Anmerkungen zu DeepImpact und COIL, zwei Information-Retrieval-Techniken. Er führt auch ein konzeptuelles Framework zum Verständnis und zur Anwendung dieser und anderer verwandter Methoden ein.

AI models frameworks DeepImpact Information Retrieval

DOCDEV.to AI·4/26/2026

What 40 Channels Means in AutoSearch

Der Text erklärt, dass "40 Kanäle" in AutoSearch einen quellenspezifischen Forschungszugang über verschiedene Ökosysteme wie Web, Akademisch, Entwickler, Soziale Medien und Video bedeutet. Jeder Kanal stellt eine eigene Quellenfamilie dar, die es Agenten und Menschen ermöglicht, präzisere Recherchen durchzuführen und Ergebnisse besser zu beurteilen.

search AI data sources Information Retrieval

ARTICLEDeepLearning.AI (YouTube)·vor 18T

Semantic Search Starts With Embeddings

Dieser Inhalt befasst sich mit dem Konzept der semantischen Suche und betont, dass diese mit der Verwendung von Embeddings beginnt. Er beleuchtet die technische Grundlage der bedeutungsorientierten Informationsbeschaffung.

natural language processing semantic search embeddings AI