Natural Language Processing

168 items

RESEARCHarXiv CS.CL·4/20/2026

DALM: A Domain-Algebraic Language Model via Three-Phase Structured Generation

DALM (Domain-Algebraic Language Model) wird vorgeschlagen, um Wissensinterferenzen in LLMs zu beheben, indem die unbeschränkte Token-Generierung durch strukturiertes Denoising über ein Domänen-Gitter ersetzt wird. Es folgt einem dreiphasigen Generierungspfad (Domänen-, Relations-, Konzeptunsicherheit) unter algebraischen Einschränkungen, wodurch eine domänenübergreifende Kontamination strukturell verhindert wird.

language models machine learning Natural Language Processing AI Research

RESEARCHarXiv CS.CL·4/17/2026

Hierarchical Retrieval Augmented Generation for Adversarial Technique Annotation in Cyber Threat Intelligence Text

Dieses Paper stellt H-TechniqueRAG vor, ein neuartiges hierarchisches Retrieval-Augmented Generation (RAG)-Framework, das die Annotation von adversariellen Techniken in Cyber Threat Intelligence (CTI)-Texten verbessern soll. Es behebt die Einschränkungen flacher RAG-Ansätze, indem es die inhärente Taktik-Technik-Taxonomie des MITRE ATT&CK-Frameworks durch einen zweistufigen Abrufmechanismus einbindet.

cybersecurity RAG Natural Language Processing MITRE ATT&CK

RESEARCHarXiv CS.CL·4/22/2026

Syntax as a Rosetta Stone: Universal Dependencies for In-Context Coptic Translation

Dieses Papier stellt einen neuen In-Context-Lernansatz für die maschinelle Übersetzung aus dem Koptischen ins Englische für ressourcenarme Sprachen vor, der Eingaben mit syntaktischen Informationen aus Universal Dependencies-Parses erweitert. Die Kombination dieser syntaktischen Daten mit wörterbuchbasierten Glossaren erzielt signifikante Leistungssteigerungen und erreicht den aktuellen Stand der Technik.

universal-dependencies Natural Language Processing machine translation in-context learning

RESEARCHarXiv CS.CL·4/22/2026

Probing for Reading Times

Diese Forschung untersucht Sprachmodellrepräsentationen auf menschliche Lesezeiten in fünf Sprachen und vergleicht sie mit skalaren Prädiktoren. Es zeigt sich, dass frühe Schichten der Sprachmodelle die Überraschung bei der Vorhersage von Frühpass-Lesemaßen übertreffen, was eine funktionale Ausrichtung zwischen Modelltiefe und den zeitlichen Stadien des menschlichen Lesens nahelegt.

language models human-computer interaction cognitive science Natural Language Processing

RESEARCHDEV.to AI·4/21/2026

Improving Video-Text Retrieval by Multi-Stream Corpus Alignment and Dual SoftmaxLoss

Diese Forschung schlägt eine neuartige Methode zur Verbesserung der Video-Text-Retrieval durch die Integration von Multi-Stream-Korpus-Ausrichtung vor. Sie führt auch eine Dual SoftmaxLoss-Funktion ein, um die Genauigkeit und Effizienz der Zuordnung von Videoinhalten zu Textbeschreibungen weiter zu verbessern.

machine learning computer vision Natural Language Processing Information Retrieval

DOCDEV.to AI·vor 6T

Email Spam Classifier with Streamlit and Docker

Dieser Leitfaden beschreibt eine vollständige Machine-Learning-Pipeline zur E-Mail-Spam-Klassifizierung. Er vergleicht Naive-Bayes- und RoBERTa-Modelle, visualisiert mit Streamlit und implementiert mit Docker.

Docker Streamlit machine learning Natural Language Processing

NEWSDEV.to AI·vor 29T

We gave actual claws to Openclaw agent and it flies a drone now

Der Openclaw-Agent, der kürzlich viral ging, weil er eine Drohne mit einem natürlichsprachlichen Prompt steuerte, kann nun Drohnen autonom über Mavlink auf Dimensional steuern. Diese Open-Source-Entwicklung ermöglicht es dem Agenten, Wahrnehmung, Verfolgung und Flugsteuerung durch eine einzige natürlichsprachliche Abfrage zu handhaben.

Open Source Autonomous systems Natural Language Processing robotics

RESEARCHarXiv CS.CL·4/13/2026

Uncertainty Estimation for the Open-Set Text Classification systems

Diese Arbeit konzentriert sich auf die genaue Unsicherheitsabschätzung für Open-Set-Textklassifizierung (OSTC)-Systeme, bei denen Textproben in bestehende Klassen eingeteilt oder als unbekannt abgelehnt werden können. Sie adaptiert die Holistic Uncertainty Estimation (HolUE)-Methode für den Textbereich, um Text- und Galerieunsicherheiten zu erfassen, und schlägt einen neuen OSTC-Benchmark vor.

machine learning Natural Language Processing trustworthy AI Uncertainty Estimation

RESEARCHarXiv CS.AI·vor 29T

More Thinking, More Bias: Length-Driven Position Bias in Reasoning Models

Eine neue Forschung zeigt, dass die Positionsverzerrung in Schlussfolgerungsmodellen, wie Chain-of-thought, mit der Länge der Schlussfolgerungstrajektorie skaliert. Dieser Effekt wurde über verschiedene Modellkonfigurationen und Benchmarks hinweg beobachtet, was darauf hindeutet, dass „mehr Nachdenken“ bestimmte Verzerrungen verstärken kann.

AI bias Natural Language Processing reasoning models Machine learning research

RESEARCHarXiv CS.CL·vor 21T

SKG-Eval: Stateful Evaluation of Multi-Turn Dialogue via Incremental Semantic Knowledge Graphs

SKG-Eval befasst sich mit der Herausforderung der Evaluierung von Multi-Turn-Dialogsystemen, indem es den Dialog als einen sich entwickelnden Semantischen Wissensgraphen (SKG) modelliert. Dieses Framework aktualisiert den Graphen inkrementell durch strukturierte Tripel-Extraktion, um weitreichende Probleme wie Widersprüche und Inkonsistenzen zu erkennen, und bietet eine verbesserte Evaluierung jenseits von turn-isolierten Repräsentationen.

Knowledge Graphs Natural Language Processing Evaluation Metrics dialogue systems

RESEARCHarXiv CS.CL·vor 7T

Cognitive-Linguistic Indicators of Depression in Online Communities: Analysed by DistilBERT and Holographic Reduced Representation

Diese Arbeit untersucht, ob die Kombination kognitiv fundierter linguistischer Merkmale mit transformatorbasierten Embeddings die automatisierte Erkennung von Depressionen in Online-Texten verbessert. Die Studie vergleicht ein TF-IDF-Basismodell mit einem hybriden DistilBERT-HRR-Modell und zeigt, dass letzteres einen deutlich höheren Makro-F1-Score von 0.94 erreicht.

online-communities depression detection machine learning Natural Language Processing

ARTICLEDEV.to AI·5/7/2026

The Transformer: The Architecture Behind Modern AI

Die Transformer-Architektur, 2017 von Vaswani eingeführt, markierte einen entscheidenden Wandel in der KI vom sequenziellen zur parallelen Verarbeitung durch ihren Aufmerksamkeitsmechanismus. Diese Innovation ermöglicht es Modellen, Bedeutung und Kontext gleichzeitig zu verarbeiten, ähnlich wie direkt in einer Sprache zu denken.

AI architecture Attention Mechanism Transformer machine learning

RESEARCHDEV.to AI·vor 25T

A Survey on Gender Bias in Natural Language Processing

Eine Umfrage zu Geschlechtervorurteilen in der Verarbeitung natürlicher Sprache analysiert, wie Geschlechterstereotype in KI-Modellen perpetuiert werden. Die Studie erörtert Methoden zur Minderung dieser Vorurteile und untersucht Herausforderungen bei der Schaffung gerechterer NLP-Systeme.

AI bias Natural Language Processing AI ethics gender bias

ARTICLEDEV.to AI·vor 23T

Understanding How ChatGPT Generates Images: A Deep Dive into AI Creativity

Dieser Artikel untersucht, wie ChatGPT zur Bilderzeugung beiträgt, die zugrunde liegenden Technologien und die Auswirkungen für Entwickler, Künstler und Unternehmen. Die Fähigkeit, Bilder aus Textbeschreibungen zu erstellen, rationalisiert Prozesse und demokratisiert die Kunst, was die Produktivität steigert.

AI Creativity ChatGPT image generation Natural Language Processing

RESEARCHDEV.to AI·5/1/2026

Deep Dyna-Q: Integrating Planning for Task-Completion Dialogue Policy Learning

Dieser Inhalt behandelt Deep Dyna-Q, einen Ansatz, der Planung in das Lernen von Dialogrichtlinien für aufgabenorientierte Dialogsysteme integriert. Das Ziel ist es, den Prozess der Aufgabenbewältigung durch dialogische Interaktion mit KI zu optimieren.

reinforcement learning Natural Language Processing AI algorithms dialogue systems

RESEARCHDEV.to AI·4/27/2026

Using WordNet to Complement Training Information in Text Categorization

Dieser Inhalt behandelt die Anwendung von WordNet zur Ergänzung von Trainingsinformationen in der Textkategorisierung. Er konzentriert sich darauf, semantische Informationen aus WordNet zu nutzen, um die Leistung und Genauigkeit von Textklassifikationsmodellen zu verbessern.

Text Categorization machine learning Natural Language Processing WordNet

RESEARCHDEV.to AI·vor 26T

Generative Simulation Benchmarking for heritage language revitalization programs for extreme data sparsity scenarios

Der Text behandelt die Herausforderung, Sprachmodelle für kritisch bedrohte Kultursprachen unter extremen Datensparsamkeitsszenarien zu entwickeln. Der Autor schildert seine persönlichen Erfahrungen mit einem winzigen Datensatz für eine Sprache wie Halkomelem und betont die Notwendigkeit neuartiger Ansätze für solche Situationen.

language models Natural Language Processing Data Sparsity endangered languages

CASEAWS Machine Learning Blog·vor 12T

Training Azerbaijani language models on Amazon SageMaker AI

Azercell Telecom hat sich mit dem AWS Generative AI Innovation Center zusammengetan, um ein großes Sprachmodell (LLM) für Aserbaidschanisch auf Amazon SageMaker AI zu entwickeln. Diese sechswöchige Zusammenarbeit etablierte einen produktionsbereiten Rahmen für Telekommunikationsanwendungsfälle und einen kundenorientierten Chatbot, wobei Herausforderungen wie Datenknappheit und sprachliche Komplexität überwunden wurden.

Telecommunications Natural Language Processing Amazon SageMaker Generative AI

RESEARCHDEV.to AI·4/25/2026

JSUT corpus: free large-scale Japanese speech corpus for end-to-end speechsynthesis

Der JSUT-Korpus ist ein kostenloser, großer japanischer Sprachdatensatz, der für die End-to-End-Sprachsyntheseforschung entwickelt wurde. Er bietet wertvolle Ressourcen für die Entwicklung fortschrittlicher KI-Modelle in der Sprachtechnologie für die japanische Sprache.

japanese language speech synthesis machine learning Natural Language Processing

NEWSDEV.to AI·4/19/2026

Claude Code's Playwright MCP Server: Generate Web Tests from Natural Language

Claude Code integriert sich nun über einen dedizierten Model Context Protocol (MCP) Server mit Playwright, was die Generierung vollständiger Testautomatisierung aus Prompts in natürlicher Sprache ermöglicht. Diese direkte Verbindung befähigt Entwickler, Testszenarien zu beschreiben, Claude Playwright-Code schreiben und ausführen zu lassen und Ergebnisse direkt im Terminal zu melden.

Claude Code Natural Language Processing Playwright AI