natural language processing

167 items

RESEARCHarXiv CS.CL·vor 7T

DraDDP: A Multimodal Multi-Party Dialogue Discourse Parsing Dataset

Diese Arbeit stellt DraDDP vor, den ersten öffentlich verfügbaren englischen multimodalen Datensatz für die Analyse des Diskurses von Mehrparteien-Dialogen, basierend auf amerikanischen TV-Dramen. Er enthält 495 Dialogsegmente und zeigt den Wert multimodaler Informationen beim Erfassen von Dialogstrukturen und Beziehungstypen auf.

Dataset Dialogue Parsing multimodal AI natural language processing

RESEARCHarXiv CS.CL·4/6/2026

Dependency-Guided Parallel Decoding in Discrete Diffusion Language Models

Modelos de linguagem de difusão discreta (dLLMs) aceleram a geração de texto, mas a decodificação paralela degrada a qualidade ao desconsiderar a dependência entre tokens. DEMASK propõe um preditor leve que estima influências condicionais para guiar o desmascaramento simultâneo, comprovadamente melhorando a qualidade. A técnica resulta em um ganho de velocidade de 1.7 a 2.2x, mantendo ou superando o desempenho.

Dependency Prediction DEMASK Parallel Decoding machine learning

RESEARCHarXiv CS.CL·vor 4T

Multi-Granularity Reasoning for Natural Language Inference

Die Arbeit schlägt ein neuartiges Multi-Granularitäts-Reasoning-Netzwerk (MGRN) für Natural Language Inference (NLI) vor. Es adressiert die Einschränkungen bestehender Transformer-basierter Modelle, indem es hierarchische semantische Merkmale nutzt, um komplexe Interaktionen für effektives Reasoning zu erfassen.

deep learning Natural Language Inference machine learning natural language processing

RESEARCHarXiv CS.CL·vor 4T

Efficient Punctuation Restoration via Weighted Lookahead Scoring Method for Streaming ASR Systems

Dieses Papier stellt eine nicht-autoregressive Bewertungsmethode zur effizienten Interpunktionswiederherstellung in Streaming-ASR-Systemen vor. Es vergleicht Interpunktionseinfügehypothesen mit einer Nicht-Einfüge-Baseline unter Verwendung eines begrenzten K-Subwort-Token-Lookaheads und übertrifft prompt-basierte Ansätze.

machine learning natural language processing Automatic Speech Recognition

RESEARCHDEV.to AI·vor 22T

Solving Math Word Problems by Combining Language Models With Symbolic Solvers

Diese Forschung untersucht einen neuartigen Ansatz zur Lösung mathematischer Textaufgaben durch die Kombination der Leistungsfähigkeit von Sprachmodellen mit der Präzision symbolischer Löser. Die Methode zielt darauf ab, sowohl das Verständnis natürlicher Sprache als auch formale mathematische Argumentation zu nutzen, um robuste Lösungen zu erzielen.

mathematical reasoning Symbolic AI natural language processing problem-solving

DOCDEV.to AI·5/2/2026

Automating Your Literature Review: A Practical AI Approach

Dieser Inhalt erklärt, wie KI-Automatisierung Literaturrecherchen optimieren kann, indem die Datenextraktion aus PDFs zu einem vereinfachten, weniger fehleranfälligen Prozess wird. Er betont die Bedeutung einer iterativen Verfeinerungsschleife und stellt die Open-Source-Bibliothek GROBID zur strukturierten akademischen Datenextraktion vor.

research Data Extraction natural language processing AI

ARTICLEDEV.to AI·4/23/2026

How to Cross-Examination in a Click: Finding Inconsistencies Across Witness Statements

Dieser Inhalt beschreibt, wie KI die komplexe Aufgabe automatisieren kann, Inkonsistenzen in mehreren Zeugenaussagen für gerichtliche Kreuzverhöre zu finden. Die Methode beinhaltet den Übergang von der Zusammenfassung einzelner Aussagen zu einer einheitlichen Vergleichsanalyse durch die Ausrichtung von Entitäten und Ereignissen.

AI applications Document analysis natural language processing legal tech

DOCAWS Machine Learning Blog·vor 19T

Integrating AWS API MCP Server with Amazon Quick using Amazon Bedrock AgentCore Runtime

Dieser Beitrag zeigt, wie Amazon Quick über den AWS API MCP Server mit AWS-Diensten unter Verwendung des Amazon Bedrock AgentCore Runtime mit MCP-Unterstützung verbunden werden kann. Er demonstriert die Erstellung eines konversationellen KI-Assistenten, der natürliche Sprache in AWS CLI-Befehle übersetzt, um Arbeitsabläufe zu optimieren.

integration natural language processing Amazon Bedrock AWS

RESEARCHarXiv CS.AI·4/15/2026

Narrative-Driven Paper-to-Slide Generation via ArcDeck

ArcDeck ist ein Multi-Agenten-KI-Framework, das Präsentationen aus wissenschaftlichen Arbeiten generiert, indem es den logischen Fluss und die narrative Struktur des Papiers explizit modelliert. Es nutzt einen Diskursbaum und iterative agentenbasierte Verfeinerung, um Kohärenz zu gewährleisten, und zeigt signifikante Verbesserungen bei den generierten Präsentationen.

paper-to-slide generation natural language processing academic presentations AI

RESEARCHarXiv CS.CL·4/23/2026

OThink-SRR1: Search, Refine and Reasoning with Reinforced Learning for Large Language Models

OThink-SRR1 ist ein Framework, das LLMs durch einen iterativen Such-, Verfeinerungs- und Denkprozess, der mittels Reinforcement Learning trainiert wird, verbessert. Es löst RAG-Herausforderungen, indem es relevante Fakten aus abgerufenen Dokumenten destilliert, um Effizienz und Genauigkeit bei komplexen Multi-Hop-QA zu steigern.

multi-hop-qa LLMs reinforcement learning RAG

RESEARCHarXiv CS.CL·vor 19T

Long-Context Reasoning Through Proxy-Based Chain-of-Thought Tuning

Große Sprachmodelle zeigen trotz Unterstützung umfangreicher Eingaben schlechte Leistungen bei komplexen Langkontext-Argumentationsaufgaben. ProxyCoT ist ein neuer Trainingsansatz, der Argumentationsfähigkeiten von kurzen Proxy-Kontexten auf vollständige lange Kontexte überträgt und starke Baselines übertrifft.

machine learning natural language processing Reasoning large language models

RESEARCHarXiv CS.CL·vor 6T

Fixing FOLIO and MALLS: Verified Annotations and an LLM-assisted Framework to Focus Human Relabeling

Eine systematische Überprüfung der Validierungsaufteilungen von extsf{FOLIO} und extsf{MALLS} zeigte hohe Raten inkorrekter FOL-Formalisierungen und mehrdeutiger NL-Sätze, die die Bewertung von KI-Modellen verzerren. Die Autoren entwickelten und veröffentlichten korrigierte Ground Truths für diese Datensätze und zeigten, wie Annotationsfehler die Bewertung modernster LLMs beeinflussen.

LLMs Neurosymbolic AI natural language processing Benchmarks

ARTICLEDEV.to AI·vor 15T

Origin Part 12: The Adapter

Dieser Artikel beschreibt ein Problem beim Einsatz eines neuen KI-Encoders, der, obwohl er die Konzeptfindung erheblich verbesserte, jede Antwort brach. Er erläutert die Rolle des "Dispatchers" im Origin-System, der als Vermittler zwischen Encoder und Antwort fungiert und Konzeptaktivierungen verarbeitet, um geeignete Aktionen zu bestimmen.

natural language processing Debugging system architecture AI development

DOCDEV.to AI·vor 6T

Email Spam Classifier with Streamlit and Docker

Dieser Leitfaden beschreibt eine vollständige Machine-Learning-Pipeline zur E-Mail-Spam-Klassifizierung. Er vergleicht Naive-Bayes- und RoBERTa-Modelle, visualisiert mit Streamlit und implementiert mit Docker.

Docker Streamlit machine learning natural language processing

RESEARCHarXiv CS.CL·5/1/2026

Targeted Linguistic Analysis of Sign Language Models with Minimal Translation Pairs

Der Artikel stellt ASL-MTP vor, einen neuen Benchmark-Datensatz zur Analyse, wie gut Gebärdensprachmodelle sprachliche Phänomene erfassen und multiartikulatorische Hinweise nutzen. Dieser Datensatz wird für eine gezielte linguistische Analyse eines hochmodernen ASL-Englisch-Übersetzungsmodells verwendet.

machine learning Sign Language AI Benchmarking natural language processing

RESEARCHarXiv CS.CL·vor 22T

Greedy or not, here I come: Language production under vocabulary constraints in humans and resource-rational models

Diese Forschung untersucht, wie Menschen mit begrenztem Wortschatz kommunizieren, und vergleicht ihre Strategien mit computationalen Stichprobenalgorithmen, die von großen Sprachmodellen angetrieben werden. Die Studie zeigt, dass die menschliche Sprachproduktion unter Einschränkungen oft dem Greedy-Sampling ähnelt, obwohl erfahrenere Personen nicht-greedy Revisionsverhalten zeigen.

cognitive science human behavior language production natural language processing

RESEARCHarXiv CS.CL·vor 22T

Fluency and Faithfulness in Human and Machine Literary Translation

Diese Studie untersucht das Gleichgewicht zwischen Flüssigkeit und Treue in der literarischen Übersetzung, indem sie menschliche Übersetzungen, Google Translate und TranslateGemma von 106 Romanen in 16 Sprachen vergleicht. Sie zeigt eine konsistente negative Korrelation zwischen Flüssigkeit und Treue, die bei menschlichen und Google Translate Übersetzungen stärker ist, und betont, dass die Segmentlänge für die automatische Bewertung wichtig ist.

Literary Translation Translation Evaluation natural language processing machine translation

RESEARCHarXiv CS.CL·vor 15T

Learnability-Informed Fine-Tuning of Diffusion Language Models

Diese Forschung stellt LIFT vor, einen lerbarkeitsinformierten Fine-Tuning-Algorithmus, der entwickelt wurde, um die Schlussfolgerungsfähigkeiten von Diffusions-Sprachmodellen zu verbessern. LIFT behebt Mängel des Standard-SFT, indem es Token adaptiv basierend auf deren Schwierigkeit und dem verfügbaren Kontext während verschiedener Diffusionszeitschritte lernt und dabei eine verbesserte Leistung gegenüber bestehenden Baselines zeigt.

Diffusion Models learning machine learning natural language processing

ARTICLEDEV.to AI·5/1/2026

From Mumbles to Memos: Teaching AI to Decipher Technician Voice Notes

Dieser Artikel behandelt den Produktivitätsengpass, der durch das manuelle Entziffern von Sprachnotizen von Technikern entsteht, und schlägt KI als Lösung vor, um Feldaufnahmen in professionelle Zusammenfassungen umzuwandeln. Er beschreibt eine Methodik, das 'Actionable Framework: The 3-Part Jargon List', um die KI darin zu schulen, spezifische Informationen aus unstrukturierten Audiodaten zu kategorisieren.

workflow automation AI training productivity natural language processing

RESEARCHarXiv CS.AI·4/6/2026

Competency Questions as Executable Plans: a Controlled RAG Architecture for Cultural Heritage Storytelling

Este conteúdo apresenta uma arquitetura RAG (Retrieval Augmented Generation) controlada que utiliza perguntas de competência como planos executáveis. O objetivo é aplicar essa metodologia para a criação de narrativas no campo do patrimônio cultural.

cultural heritage storytelling natural language processing AI