← heapsort-ai

Information Retrieval

36 items

RESEARCHarXiv CS.CL·vor 20Std

Bidirectional Small-Granularity Search between Code and Text

Diese Forschung stellt eine neue Aufgabe vor: die bidirektionale Suche mit kleiner Granularität zwischen Code und Text, die wissenschaftliche Publikationen mit entsprechenden Codesegmenten verknüpfen soll. Sie schlägt einen großen Datensatz vor, teilweise generiert von GPT-4, und einen modularen Ansatz, der gute Ergebnisse erzielt.

54
ARTICLE↑ trendingHacker News (AI)·vor 7T

RSS is back. AI agents are reading it

RSS erlebt ein Wiederaufleben als effektiver Weg für KI-Agenten, Webinhalte zu konsumieren, indem es einen strukturierten und aktuellen Informationsfeed bietet. Dies ermöglicht es KI-Modellen, große Datenmengen effizienter zu verarbeiten und darauf zuzugreifen, was ein neues Kapitel für diese ehemals als obsolet angesehene Technologie darstellt.

42
ARTICLEDEV.to AI·vor 18T

📚 The Book Pattern: Progressive Disclosure for AI Agents

Dieser Artikel stellt das 'Buchmuster' und die 'progressive Offenlegung' als mentales Modell dafür vor, wie KI-Agenten Informationen konsumieren sollten. Er schlägt vor, dass Agenten schrittweise mit Projektdetails interagieren, beginnend mit Übersichten und nur bei Bedarf tiefer gehend, was das menschliche Verhalten beim Lesen von Büchern widerspiegelt.

34
RESEARCHarXiv CS.CL·vor 21T

Retrieval-Based Multi-Label Legal Annotation: Extensible, Data-Efficient and Hallucination-Free

Der Artikel schlägt vor, die mehrfache juristische Annotation als Abrufaufgabe zu betrachten, wobei eingefrorene Modelle und k-nächste Nachbarn zur Zuweisung von Labels verwendet werden. Diese Methode erzielt eine wettbewerbsfähige Genauigkeit und eine hohe Dateneffizienz auf juristischen Datensätzen, wodurch die Rechenkosten im Vergleich zum Fine-Tuning großer Sprachmodelle erheblich gesenkt werden.

29
ARTICLEDEV.to AI·vor 22T

GraphRAG vs vector RAG: when the knowledge graph pays for itself

Dieser Inhalt vergleicht GraphRAG und Vector RAG, wobei die Einschränkungen von Vector RAG für die ganzheitliche Korpusanalyse hervorgehoben werden und wie GraphRAG diese Lücke durch LLM-extrahierte Wissensgraphen und hierarchische Zusammenfassungen schließt. Er erörtert auch die deutlich höheren Indexierungskosten von GraphRAG und wann dieser Aufwand gerechtfertigt ist.

28
DOCDEV.to AI·4/22/2026

RAG Systems in Production: Building Enterprise Knowledge Search

Retrieval-Augmented Generation (RAG)-Systeme werden als revolutionärer Ansatz für Unternehmen vorgestellt, um intelligente Wissenssysteme aufzubauen, indem sie LLMs mit domänenspezifischem Wissen kombinieren. Dieser Leitfaden, basierend auf der Erfahrung von Groovy Web mit Fortune-500-Unternehmen, deckt den umfassenden Prozess des Aufbaus und der Bereitstellung produktionsreifer RAG-Systeme ab, von der Architektur bis zum Monitoring.

28
RESEARCHDEV.to AI·4/21/2026

Improving Video-Text Retrieval by Multi-Stream Corpus Alignment and Dual SoftmaxLoss

Diese Forschung schlägt eine neuartige Methode zur Verbesserung der Video-Text-Retrieval durch die Integration von Multi-Stream-Korpus-Ausrichtung vor. Sie führt auch eine Dual SoftmaxLoss-Funktion ein, um die Genauigkeit und Effizienz der Zuordnung von Videoinhalten zu Textbeschreibungen weiter zu verbessern.

27
ARTICLEDEV.to AI·4/22/2026

RAG: How AI Models Use Your Data Without Forgetting

Große Sprachmodelle sind zustandslos und haben keine Erinnerung an frühere Gespräche oder Zugriff auf aktuelle oder private Daten. RAG (Retrieval Augmented Generation) behebt dies durch die Einführung eines Abrufschritts, der es Modellen ermöglicht, auf externe Informationen zuzugreifen und als Denkmaschine über diese Daten zu fungieren.

27
ARTICLEDEV.to AI·5/8/2026

Stop Rereading Your Documents. Let the AI Study Them Once.

Dieser Inhalt beleuchtet die Ineffizienz naiver RAG-Workflows, die Antworten für statisches Wissen wiederholt neu synthetisieren, was Kosten und Inkonsistenzen verursacht. Es wird vorgeschlagen, Wissen zum Zeitpunkt der Aufnahme zu kompilieren, ein Muster, das von Andrej Karpathy (llm-wiki.md) vorgeschlagen wurde, bei dem ein LLM ein Dokument einmal liest, um strukturierte Wiki-Seiten zu erstellen. Zenii implementiert dieses optimierte Muster standardmäßig.

27
ARTICLEDEV.to AI·5/4/2026

Why Your Vector Index Returns Five Copies of the Same Doc

Der Inhalt beschreibt einen häufigen Fehler in RAG-Systemen, bei dem der Vektorindex mehrere Kopien desselben Dokumenten-Chunks zurückgibt und das Kontextfenster des LLM mit Redundanz füllt. Dies verhindert, dass das LLM auf vielfältige Informationen zugreifen und nuancierte Antworten geben kann; die Lösung umfasst Hash-Deduplizierung vor dem Ranking und MMR.

27
DOCDEV.to AI·vor 16T

RAG 시스템 실전 구축 (v18)

Dieses Dokument beschreibt die praktische Implementierung von RAG-Systemen (Retrieval-Augmented Generation) und erläutert deren Kernkonzepte und Funktionsweise. Es behandelt die Phasen der Abrufung, Erweiterung und Generierung von Kontext zur Verbesserung von LLM-Antworten, einschließlich semantischer Dokumentenfragmentierung.

27
ARTICLEDEV.to AI·vor 9T

Start Here: My AI Memory Research So Far

Der Autor beschreibt seine Forschungsreise im Bereich des KI-Speichers und detailliert vier Entdeckungsphasen über die Funktionsweise und Herausforderungen dieser Systeme. Er untersucht das Überleben des Speichers nach Resets, die Bedeutung des Korrekturspeichers, die Beziehung zwischen Abrufgenauigkeit und Sicherheit sowie den entscheidenden Unterschied zwischen Relevanz und Autorität im KI-Speicher.

27
DOCDEV.to AI·4/26/2026

What 40 Channels Means in AutoSearch

Der Text erklärt, dass "40 Kanäle" in AutoSearch einen quellenspezifischen Forschungszugang über verschiedene Ökosysteme wie Web, Akademisch, Entwickler, Soziale Medien und Video bedeutet. Jeder Kanal stellt eine eigene Quellenfamilie dar, die es Agenten und Menschen ermöglicht, präzisere Recherchen durchzuführen und Ergebnisse besser zu beurteilen.

27