← heapsort-ai

Natural Language Processing

168 items

RESEARCHarXiv CS.CL·4/20/2026

DALM: A Domain-Algebraic Language Model via Three-Phase Structured Generation

DALM (Domain-Algebraic Language Model) wird vorgeschlagen, um Wissensinterferenzen in LLMs zu beheben, indem die unbeschränkte Token-Generierung durch strukturiertes Denoising über ein Domänen-Gitter ersetzt wird. Es folgt einem dreiphasigen Generierungspfad (Domänen-, Relations-, Konzeptunsicherheit) unter algebraischen Einschränkungen, wodurch eine domänenübergreifende Kontamination strukturell verhindert wird.

27
RESEARCHarXiv CS.CL·4/17/2026

Hierarchical Retrieval Augmented Generation for Adversarial Technique Annotation in Cyber Threat Intelligence Text

Dieses Paper stellt H-TechniqueRAG vor, ein neuartiges hierarchisches Retrieval-Augmented Generation (RAG)-Framework, das die Annotation von adversariellen Techniken in Cyber Threat Intelligence (CTI)-Texten verbessern soll. Es behebt die Einschränkungen flacher RAG-Ansätze, indem es die inhärente Taktik-Technik-Taxonomie des MITRE ATT&CK-Frameworks durch einen zweistufigen Abrufmechanismus einbindet.

27
RESEARCHarXiv CS.CL·4/22/2026

Syntax as a Rosetta Stone: Universal Dependencies for In-Context Coptic Translation

Dieses Papier stellt einen neuen In-Context-Lernansatz für die maschinelle Übersetzung aus dem Koptischen ins Englische für ressourcenarme Sprachen vor, der Eingaben mit syntaktischen Informationen aus Universal Dependencies-Parses erweitert. Die Kombination dieser syntaktischen Daten mit wörterbuchbasierten Glossaren erzielt signifikante Leistungssteigerungen und erreicht den aktuellen Stand der Technik.

27
RESEARCHarXiv CS.CL·4/22/2026

Probing for Reading Times

Diese Forschung untersucht Sprachmodellrepräsentationen auf menschliche Lesezeiten in fünf Sprachen und vergleicht sie mit skalaren Prädiktoren. Es zeigt sich, dass frühe Schichten der Sprachmodelle die Überraschung bei der Vorhersage von Frühpass-Lesemaßen übertreffen, was eine funktionale Ausrichtung zwischen Modelltiefe und den zeitlichen Stadien des menschlichen Lesens nahelegt.

27
RESEARCHDEV.to AI·4/21/2026

Improving Video-Text Retrieval by Multi-Stream Corpus Alignment and Dual SoftmaxLoss

Diese Forschung schlägt eine neuartige Methode zur Verbesserung der Video-Text-Retrieval durch die Integration von Multi-Stream-Korpus-Ausrichtung vor. Sie führt auch eine Dual SoftmaxLoss-Funktion ein, um die Genauigkeit und Effizienz der Zuordnung von Videoinhalten zu Textbeschreibungen weiter zu verbessern.

27
RESEARCHarXiv CS.CL·4/13/2026

Uncertainty Estimation for the Open-Set Text Classification systems

Diese Arbeit konzentriert sich auf die genaue Unsicherheitsabschätzung für Open-Set-Textklassifizierung (OSTC)-Systeme, bei denen Textproben in bestehende Klassen eingeteilt oder als unbekannt abgelehnt werden können. Sie adaptiert die Holistic Uncertainty Estimation (HolUE)-Methode für den Textbereich, um Text- und Galerieunsicherheiten zu erfassen, und schlägt einen neuen OSTC-Benchmark vor.

27
RESEARCHarXiv CS.AI·vor 29T

More Thinking, More Bias: Length-Driven Position Bias in Reasoning Models

Eine neue Forschung zeigt, dass die Positionsverzerrung in Schlussfolgerungsmodellen, wie Chain-of-thought, mit der Länge der Schlussfolgerungstrajektorie skaliert. Dieser Effekt wurde über verschiedene Modellkonfigurationen und Benchmarks hinweg beobachtet, was darauf hindeutet, dass „mehr Nachdenken“ bestimmte Verzerrungen verstärken kann.

27
RESEARCHarXiv CS.CL·vor 21T

SKG-Eval: Stateful Evaluation of Multi-Turn Dialogue via Incremental Semantic Knowledge Graphs

SKG-Eval befasst sich mit der Herausforderung der Evaluierung von Multi-Turn-Dialogsystemen, indem es den Dialog als einen sich entwickelnden Semantischen Wissensgraphen (SKG) modelliert. Dieses Framework aktualisiert den Graphen inkrementell durch strukturierte Tripel-Extraktion, um weitreichende Probleme wie Widersprüche und Inkonsistenzen zu erkennen, und bietet eine verbesserte Evaluierung jenseits von turn-isolierten Repräsentationen.

27
RESEARCHarXiv CS.CL·vor 7T

Cognitive-Linguistic Indicators of Depression in Online Communities: Analysed by DistilBERT and Holographic Reduced Representation

Diese Arbeit untersucht, ob die Kombination kognitiv fundierter linguistischer Merkmale mit transformatorbasierten Embeddings die automatisierte Erkennung von Depressionen in Online-Texten verbessert. Die Studie vergleicht ein TF-IDF-Basismodell mit einem hybriden DistilBERT-HRR-Modell und zeigt, dass letzteres einen deutlich höheren Makro-F1-Score von 0.94 erreicht.

27
RESEARCHDEV.to AI·vor 26T

Generative Simulation Benchmarking for heritage language revitalization programs for extreme data sparsity scenarios

Der Text behandelt die Herausforderung, Sprachmodelle für kritisch bedrohte Kultursprachen unter extremen Datensparsamkeitsszenarien zu entwickeln. Der Autor schildert seine persönlichen Erfahrungen mit einem winzigen Datensatz für eine Sprache wie Halkomelem und betont die Notwendigkeit neuartiger Ansätze für solche Situationen.

27
CASEAWS Machine Learning Blog·vor 12T

Training Azerbaijani language models on Amazon SageMaker AI

Azercell Telecom hat sich mit dem AWS Generative AI Innovation Center zusammengetan, um ein großes Sprachmodell (LLM) für Aserbaidschanisch auf Amazon SageMaker AI zu entwickeln. Diese sechswöchige Zusammenarbeit etablierte einen produktionsbereiten Rahmen für Telekommunikationsanwendungsfälle und einen kundenorientierten Chatbot, wobei Herausforderungen wie Datenknappheit und sprachliche Komplexität überwunden wurden.

27
NEWSDEV.to AI·4/19/2026

Claude Code's Playwright MCP Server: Generate Web Tests from Natural Language

Claude Code integriert sich nun über einen dedizierten Model Context Protocol (MCP) Server mit Playwright, was die Generierung vollständiger Testautomatisierung aus Prompts in natürlicher Sprache ermöglicht. Diese direkte Verbindung befähigt Entwickler, Testszenarien zu beschreiben, Claude Playwright-Code schreiben und ausführen zu lassen und Ergebnisse direkt im Terminal zu melden.

27