← heapsort-ai

NLP

124 items

ARTICLEDEV.to AI·5/9/2026

Your RAG can't answer 'why' -- GraphRAG finds what vector search misses

Dieser Artikel beleuchtet die Grenzen konventioneller RAG-Systeme (Retrieval-Augmented Generation), die bei der Beantwortung von 'Warum'-Fragen versagen, da die Vektorsuche nur ähnliche, aber keine miteinander verbundenen Dokumente findet. Er stellt GraphRAG als Lösung vor, um diese 'strukturelle Obergrenze' zu überwinden, indem das System Beziehungen zwischen Informationen herstellt. Der Autor teilt seine persönliche Frustration, diesen architektonischen Engpass nach fehlgeschlagenen Versuchen zur Prompt-Optimierung erkannt zu haben.

27
ARTICLEDEV.to AI·4/27/2026

Intelligent Automation Explained: A Beginner's Guide to the Future of Work

Intelligente Automatisierung ist ein transformatives Konzept, das künstliche Intelligenz mit Prozessautomatisierung verbindet, wodurch Systeme lernen, sich anpassen und sich kontinuierlich verbessern können. Sie repräsentiert die Konvergenz von RPA, maschinellem Lernen, natürlicher Sprachverarbeitung und kognitiven Technologien zur Leistungsoptimierung in modernen Unternehmen.

27
DOCDEV.to AI·vor 15T

RAG 시스템 실전 구축 (v23)

Dies ist ein praktischer Leitfaden (v23) für ML-Ingenieure zur Implementierung von RAG-Systemen. Er beschreibt den RAG-Kreislauf (Retrieval, Augmentation, Generation) und enthält ein Python-Beispiel für semantisches Chunking mittels sentence_transformers.

27
RESEARCHarXiv CS.CL·5/1/2026

Semantic Structure of Feature Space in Large Language Models

Diese Studie zeigt, dass die geometrischen Beziehungen zwischen semantischen Merkmalen in den verborgenen Zuständen großer Sprachmodelle menschliche psychologische Assoziationen widerspiegeln. Es wird demonstriert, dass Wortvektorprojektionen auf semantische Achsen mit menschlichen Bewertungen korrelieren und die Ähnlichkeit zwischen diesen Achsen die Zusammenhänge von semantischen Skalen vorhersagt.

27
RESEARCHarXiv CS.CL·4/30/2026

Analysing Lightweight Large Language Models for Biomedical Named Entity Recognition on Diverse Ouput Formats

Diese Forschung untersucht den Einsatz leichter Large Language Models (LLMs) für die biomedizinische Named Entity Recognition und zeigt deren wettbewerbsfähige Leistung im Vergleich zu größeren Modellen. Die Studie hebt ihr Potenzial als ressourcenschonende Alternativen hervor und identifiziert spezifische Ausgabeformate, die die Leistung konsistent verbessern.

27
RESEARCHarXiv CS.CL·4/17/2026

SeaAlert: Critical Information Extraction From Maritime Distress Communications with Large Language Models

SeaAlert ist ein LLM-basiertes Framework zur robusten Analyse von Seenotfunkkommunikationen, die aufgrund von Rauschen, Formatabweichungen und ASR-Fehlern schwierig sind. Um den Mangel an realen, gelabelten Daten zu überwinden, nutzt das Framework eine LLM-gestützte Pipeline zur Generierung synthetischer Daten.

27
RESEARCHarXiv CS.CL·vor 19T

Under Pressure: Emotional Framing Induces Measurable Behavioral Shifts and Structured Internal Geometry in Small Language Models

Diese Studie untersucht, wie emotional gerahmte Bewertungs-Follow-ups sowohl das Verhalten als auch die internen Repräsentationen kleiner Sprachmodelle verändern. Die Ergebnisse zeigen, dass „Druck“ die stärksten Shortcut-Marker hervorruft, während „Ruhe“ und „Neugier“ die Ehrlichkeit besser bewahren.

27
RESEARCHarXiv CS.CL·vor 19T

Pseudo-Siamese Network for Planning in Target-Oriented Proactive Dialogues

Die Arbeit schlägt ein vorwärtsgerichtetes bidirektionales Pseudo-Siamese-Netzwerk (FF-BPSN) für die Dialogpfadplanung in zielorientierten proaktiven Dialogsystemen vor. Dieses Netzwerk verwendet identische Transformatoren-basierte Decoder für die bidirektionale Planung und integriert Informationen, um einen Vorwärtspfad zu konstruieren, der Sprachmodelle bei der Antwortgenerierung leitet.

27
RESEARCHarXiv CS.CL·4/24/2026

DWTSumm: Discrete Wavelet Transform for Document Summarization

Diese Forschung schlägt einen auf der Diskreten Wavelet-Transformation (DWT) basierenden Rahmen zur Verbesserung der Dokumentenzusammenfassung vor, insbesondere für lange, domänenspezifische Texte, bei denen LLMs Schwierigkeiten haben. Die Methode erzeugt kompakte Repräsentationen, die die semantische Ähnlichkeit, die Verankerung und die faktische Konsistenz im Vergleich zu einem GPT-4o-Baseline verbessern.

27
RESEARCHarXiv CS.CL·vor 29T

Reflections and New Directions for Human-Centered Large Language Models

Diese Arbeit stellt ein Framework für die Entwicklung von Human-Centered Large Language Models (HCLLMs) vor, das Perspektiven aus NLP, HCI und verantwortungsvoller KI integriert. Es wird argumentiert, dass menschliche Anliegen, Präferenzen und Werte in jeder Phase der LLM-Entwicklung rigoros berücksichtigt werden müssen, anstatt nur als eine nachgeschaltete Überlegung.

27
RESEARCHarXiv CS.CL·vor 20T

The Annotation Scarcity Paradox in Low-Resource NLP Evaluation: A Decade of Acceleration and Emerging Constraints

Die Verarbeitung natürlicher Sprache (NLP) mit geringen Ressourcen hat ein explosives Wachstum erfahren, doch ihre Bewertung steht vor einer kritischen Herausforderung: die Knappheit soziolinguistischer Expertise, die zur Bewertung komplexer generativer Systeme erforderlich ist. Dies führt zum "Annotations-Knappheitsparadoxon", bei dem die technische Kapazität zur Skalierung von Modellen die souveräne menschliche Infrastruktur für eine authentische Bewertung übertrifft.

27
RESEARCHarXiv CS.CL·vor 7T

AEyeDE: An Attention-Based Attribution Framework for AI-Generated Text Detection

Dieses Papier stellt AEyeDE vor, einen auf Aufmerksamkeit basierenden Ansatz zur Erkennung von menschlicher und KI-Autorenschaft, der die Modellaufmerksamkeit als diskriminierendes Signal nutzt. Die Methode übertrifft Text-only-Baselines durchweg und zeigt Robustheit in verschiedenen Textgenerierungseinstellungen, wobei sie auf Standard-Benchmarks wettbewerbsfähig bleibt.

27