NLP

124 items

ARTICLEDEV.to AI·4/25/2026

The hidden engine behind the AI Revolution: The Transformer

Der wahre Motor hinter der KI-Revolution ist nicht ChatGPT, sondern die Transformer-Architektur, eingeführt durch das Paper „Attention Is All You Need“. Diese Innovation ermöglichte massive parallele Sprachverarbeitung, nutzte GPUs und veränderte grundlegend, wie Maschinen Sprache verstehen.

AI history deep learning Transformer NLP

RESEARCHarXiv CS.AI·4/15/2026

GoodPoint: Learning Constructive Scientific Paper Feedback from Author Responses

Diese Forschung stellt GoodPoint vor, eine Methode, die LLMs und Autorenantworten nutzt, um konstruktives Feedback für wissenschaftliche Arbeiten zu generieren. Dabei wird GoodPoint-ICLR entwickelt, ein Datensatz von ICLR-Arbeiten, sowie ein Trainingsrezept, das Fine-Tuning und Präferenzoptimierung für gültiges und umsetzbares Feedback verwendet.

LLMs Feedback Generation machine learning NLP

RESEARCHarXiv CS.CL·4/22/2026

Scripts Through Time: A Survey of the Evolving Role of Transliteration in NLP

Dieses Papier untersucht die Rolle der Transliteration in der NLP, eine entscheidende Technik zur Überwindung der „Schriftbarriere“ im sprachübergreifenden Transfer. Es präsentiert eine Taxonomie von Motivationen und Ansätzen, analysiert deren Wirksamkeit und ordnet ihre Notwendigkeit in modernen LLMs ein.

Cross-lingual AI language models LLMs NLP

RESEARCHarXiv CS.CL·vor 29T

TajPersLexon: A Tajik-Persian Lexical Resource and Hybrid Model for Cross-Script Low-Resource NLP

Diese Arbeit stellt TajPersLexon vor, eine Tadschikisch-Persische parallele lexikalische Ressource mit 40.112 Wortpaaren für Cross-Script NLP in ressourcenarmen Umgebungen. Es werden hybride, neuronale und Retrieval-Modelle bewertet, wobei neuronale und Retrieval-Baselines eine hohe Genauigkeit (98-99%) zeigen und das hybride Modell einen günstigen Kompromiss zwischen Genauigkeit und Effizienz (96,4%) bei der OCR-Nachkorrektur bietet.

Lexical resource Cross-script NLP Hybrid model

RESEARCHarXiv CS.CL·vor 22T

Why are language models less surprised than humans? Testing the Parse Multiplicity Mismatch Hypothesis

Diese Arbeit untersucht, warum Sprachmodelle bei syntaktisch mehrdeutigen Sätzen weniger „überrascht“ sind als Menschen. Sie testet die Hypothese, dass Sprachmodelle gleichzeitig eine größere Anzahl von Satzinterpretationen berücksichtigen können, indem sie rekurrente neuronale Netzgrammatiken verwenden.

syntactic-ambiguity language models cognitive science NLP

RESEARCHarXiv CS.LG·4/21/2026

Annotation Entropy Predicts Per-Example Learning Dynamics in LoRA Fine-Tuning

Diese Forschung zeigt, dass LoRA-Fine-Tuning bei umstrittenen Beispielen ein „Entlernen“ bewirkt, wobei eine hohe AnnotatorenUneinigkeit mit einem Anstieg des Verlusts während des Trainings korreliert. Dieses Muster unterscheidet sich vom vollständigen Fine-Tuning und wird konsistent über mehrere Modelle und Datensätze hinweg beobachtet.

model training machine learning NLP Fine-tuning

RESEARCHarXiv CS.CL·5/7/2026

The Impact of Vocabulary Overlaps on Knowledge Transfer in Multilingual Machine Translation

Diese Arbeit untersucht systematisch den Einfluss von gemeinsamen und getrennten Vokabularen auf den Wissenstransfer in der mehrsprachigen neuronalen Maschinenübersetzung (MNMT). Experimente zeigen, dass umfangreiche Vokabularüberschneidungen, Sprachverwandtschaft und Domänenübereinstimmung zu besseren Ergebnissen führen, selbst in Out-of-Domain-Setups.

neural networks knowledge transfer NLP machine translation

RESEARCHarXiv CS.CL·vor 26T

Differences in Text Generated by Diffusion and Autoregressive Language Models

Diese Forschung untersucht die intrinsischen Unterschiede in Texten, die von Diffusions-Sprachmodellen (DLMs) und autoregressiven Sprachmodellen (ARMs) generiert werden, und stellt fest, dass DLMs eine geringere n-Gramm-Entropie, aber eine höhere semantische Kohärenz und Diversität aufweisen. Kontrollierte Experimente zeigen, dass die Trainingsziele von DLMs zur Erhöhung der semantischen Kohärenz und Diversität beitragen, während die Dekodierungsalgorithmen für die Entropiereduktion verantwortlich sind.

Diffusion Models language models NLP text generation

RESEARCHarXiv CS.CL·vor 13T

CroCo: Cross-Lingual Contrastive Preference Tuning on Self-Generations

Diese Arbeit stellt CroCo vor, eine Methode zur kontrastiven Präferenzeinstellung über Sprachen hinweg für selbstgenerierte Antworten von LLMs, die eine effektive Übertragung über 14 Sprachen ohne sprachspezifische Präferenzannotationen zeigt. Ein auf englischen Präferenzen trainiertes Belohnungsmodell liefert nützliche Rankings in den meisten Sprachen, verbessert bestehende Modelle und verhindert katastrophales Vergessen, vorausgesetzt, On-Policy-Daten werden verwendet.

research machine learning NLP multilingual

RESEARCHarXiv CS.CL·vor 12T

BioELX: Cross-lingual Biomedical Entity Linking via Alias-based Retrieval and LLM Ranking

BioELX ist ein zweistufiges, sprachübergreifendes biomedizinisches Entitätsverknüpfungsframework, das keine aufgabenspezifischen annotierten Trainingskorpora benötigt. Es verbessert die Kandidatenabrufung durch mehrsprachige Aliase aus Wikidata und führt eine kontextsensitive Disambiguierung mit einem vortrainierten LLM-Ranker durch.

Cross-lingual AI Entity Linking NLP Biomedical AI

DOCDEV.to AI·vor 16T

RAG 시스템 실전 구축 (v18)

Dieses Dokument beschreibt die praktische Implementierung von RAG-Systemen (Retrieval-Augmented Generation) und erläutert deren Kernkonzepte und Funktionsweise. Es behandelt die Phasen der Abrufung, Erweiterung und Generierung von Kontext zur Verbesserung von LLM-Antworten, einschließlich semantischer Dokumentenfragmentierung.

RAG NLP Information Retrieval Generative AI

ARTICLEDEV.to AI·4/24/2026

Layer Normalization — Deep Dive + Problem: Largest Connected Region

Dieser Inhalt bietet einen tiefen Einblick in die Layer-Normalisierung, eine entscheidende Komponente der Transformer-Architektur. Er beschreibt ihre Bedeutung für die Stabilisierung des Trainings und die Verbesserung der Leistung von Large Language Models (LLMs), die ihren Ursprung im Papier „Attention is All You Need“ hat.

Transformer Architecture LLMs deep learning NLP

ARTICLEDEV.to AI·vor 8T

AI debt sales reshape global corporate bond markets

Die Integration von KI im Schuldenverkauf wird die globalen Unternehmensanleihemärkte erheblich verändern, angetrieben durch die Fähigkeit von KI-Systemen, große Datenmengen zu analysieren und präzise Vorhersagen zu treffen. KI-Schuldenverkaufsplattformen nutzen maschinelle Lernalgorithmen und natürliche Sprachverarbeitung, um die Kreditwürdigkeit zu bewerten und Risiken sowie Chancen zu identifizieren.

Finance Debt Markets machine learning NLP

ARTICLEDEV.to AI·4/27/2026

Epismo Agent Package

Die technische Analyse des Epismo Agent Package beschreibt eine innovative Lösung zur Erstellung von KI-gesteuerten digitalen Menschen für Kundenservice, Unterhaltung und Bildung. Seine Microservices-Architektur integriert natürliche Sprachverarbeitung, maschinelles Lernen und Computer Vision, verwaltet von einem Agent Core und einem Knowledge Graph.

digital humans computer vision NLP ML

RESEARCHarXiv CS.CL·4/21/2026

QU-NLP at QIAS 2026: Multi-Stage QLoRA Fine-Tuning for Arabic Islamic Inheritance Reasoning

Der Artikel beschreibt die mehrstufige QLoRA-Feinabstimmungsstrategie von QU-NLP für das arabisch-islamische Erbschaftsargumentation unter Verwendung von Qwen3-4B. Das Modell erreichte einen MIR-E-Score von 90 % und zeigte eine wettbewerbsfähige Leistung bei minimalem Rechenaufwand.

LLMs Legal AI Arabic AI NLP

DOCDEV.to AI·vor 20T

92. BERT: The Model That Reads in Both Directions

BERT unterscheidet sich von GPT durch seine bidirektionale Lesefähigkeit, bei der maskierte Wörter anstelle von sequentiellen Wörtern vorhergesagt werden. Dieses umfassende Kontextverständnis machte es dominant bei NLP-Benchmarks und zu einem Eckpfeiler für Verständnisaufgaben. Der Inhalt beschreibt die Vortrainingsmechanismen und Feinabstimmungstechniken von BERT.

BERT GPT machine learning NLP

ARTICLEDEV.to AI·vor 26T

NLP Video Editing Copilot

Cutting Room AI ist eine eigenständige Windows-Desktop-App, die DaVinci Resolve Studio-Benutzern ermöglicht, ihre Timeline mit einfacher englischer Sprache zu steuern. Sie übersetzt natürliche Sprachbefehle in Skripting-API-Aufrufe, wodurch Benutzer Clipeigenschaften ändern und Spuroperationen ausführen können, ohne Skripting-Kenntnisse zu benötigen.

desktop app NLP DaVinci Resolve AI tools

DOCDEV.to AI·vor 26T

Spellar 3.0

Spellar 3.0 ist eine KI-gesteuerte Sprachlernplattform, die personalisierten Unterricht und Feedback bietet. Ihre technische Architektur umfasst ein React-Frontend, ein Node.js-Backend mit PostgreSQL und eine NLP-Engine zur Analyse von Benutzereingaben in mehreren Sprachen.

gamification learning language learning AI platform

ARTICLEDEV.to AI·4/27/2026

Building Smart Fairness Analyzer: An AI-Powered Bias Detection App with MongoDB & NLP

Dieses Projekt stellt den Smart Fairness Analyzer vor, eine Plattform, die entwickelt wurde, um Geschlechts-, Rassen-, Alters- und sozioökonomische Verzerrungen in KI-Antworten in Echtzeit zu erkennen und zu prüfen. Das Tool verwendet akademische ML-Fairness-Metriken und speichert vollständige Prüfpfade in MongoDB zur Analyse.

ethics bias detection machine learning AI fairness

ARTICLEDEV.to AI·4/24/2026

Bringing it to Life: The Real-Time Inference Engine (Part 3)

Dieser Artikel, Teil 3 einer Serie, beschreibt die Echtzeit-Inferenz-Engine für ein ASL-zu-Sprache-Projekt, das die Herausforderung der Verarbeitung unendlicher Webcam-Streams angeht. Er erklärt die Sliding-Window-Architektur zur Dekodierung von Körper-Keypoints in Gebärdensprache-Glossen und die Nutzung von LLMs zur Generierung von gesprochenem Englisch.

sign-language machine learning computer vision NLP