← heapsort-ai

natural language processing

167 items

RESEARCHarXiv CS.CL·4/22/2026

Model-Agnostic Meta Learning for Class Imbalance Adaptation

Dieses Papier stellt Hardness-Aware Meta-Resample (HAMR) vor, ein vereinheitlichtes Framework zur adaptiven Bewältigung von Klassenungleichgewicht und Datenschwierigkeiten bei NLP-Aufgaben. HAMR nutzt Bi-Level-Optimierungen und einen Nachbarschafts-bewussten Resampling-Mechanismus, um wirklich herausfordernde Stichproben und Minderheitsklassen zu priorisieren, und erzielt erhebliche Verbesserungen bei verschiedenen unausgewogenen Datensätzen.

35
RESEARCHarXiv CS.CL·vor 18T

Broadening Access to Transportation Safety Data with Generative AI: A Schema-Grounded Framework for Spatial Natural Language Queries

Dieses Papier stellt eine schema-basierte natürliche Sprachschnittstelle vor, die Generative KI verwendet, um Verkehrsicherheitsdaten zugänglicher zu machen. Ziel ist es, die Lücke für Praktiker zu schließen, indem Benutzeranfragen in strukturierte semantische Rahmen für eine zuverlässige Analyse übersetzt werden.

33
RESEARCHarXiv CS.CL·4/22/2026

Remask, Don't Replace: Token-to-Mask Refinement in Masked Diffusion Language Models

Dieses Papier schlägt eine neue Technik, das Token-to-Mask (T2M) Remasking, zur Verfeinerung maskierter Diffusions-Sprachmodelle wie LLaDA2.1 vor. Die Methode behebt die Mängel der Token-to-Token (T2T)-Bearbeitung, indem sie verdächtige Token in einen Maskierungszustand zurücksetzt, was eine genauere Neuprädiktion ermöglicht.

32
DOCDEV.to AI·vor 5T

Cignara

Cignara ist eine cloudbasierte, KI-gestützte Plattform zur Optimierung von Datenanalyse, Automatisierung und Entscheidungsfindung unter Nutzung von ML und NLP. Ihre Architektur umfasst Cloud-Infrastruktur, eine Datenverarbeitungsschicht und eine KI/ML-Engine mit NLP-Modellen und prädiktiver Analytik.

32
RESEARCHarXiv CS.AI·vor 5T

SMAC-Talk: A Natural Language Extension of the StarCraft Multi-Agent Challenge for Large Language Models

Dieser Artikel stellt SMAC-Talk vor, eine natürliche Spracherweiterung der StarCraft Multi-Agent Challenge, die zur Bewertung von LLM-basierten Agenten in kooperativen Multi-Agenten-Umgebungen dient. Sie umfasst einen natürlichen Sprachkommunikationskanal, um die Koordination und das Vertrauen von Agenten zu untersuchen, einschließlich Szenarien mit täuschenden Kommunikatoren.

31
DOCDEV.to AI·4/16/2026

LLM vs RAG

Dieser Inhalt vergleicht LLMs (Large Language Models) und RAG (Retrieval-Augmented Generation) und beleuchtet ihre Kernunterschiede bezüglich Typ, Wissensquelle, Genauigkeit und Anwendungsfällen. Es wird erklärt, dass RAG die faktische Grundlage von LLMs durch die Integration externer Echtzeitdaten verbessert und somit Halluzinationen reduziert.

31
RESEARCHarXiv CS.CL·4/16/2026

A Multi-Model Approach to English-Bangla Sentiment Classification of Government Mobile Banking App Reviews

Diese Studie klassifiziert die Stimmung in englischen und bengalischen Rezensionen von mobilen Banking-Apps der bangladeschischen Regierung, basierend auf einem hybriden Etikettierungsansatz für 5.652 Rezensionen. Es wurde festgestellt, dass traditionelle Machine-Learning-Modelle wie Random Forest und Linear SVM XLM-RoBERTa für diese spezifische Aufgabe deutlich übertrafen.

31
ARTICLEDEV.to AI·vor 3T

Day 48 of GoDavaii: Building Health AI for 22 Indian Languages - Why It's Harder Than You Think

Der Artikel beschreibt die Herausforderungen beim Aufbau einer Gesundheits-KI, die die Nuancen der 22 offiziellen Sprachen Indiens wirklich versteht, veranschaulicht durch die Komplexität der Interpretation eines einfachen Satzes. Am 48. Tag nach dem Start befasst sich GoDavaii mit immensen sprachlichen Komplexitäten, um eine KI zu schaffen, die über englischzentrierte Lösungen hinausgeht.

30
RESEARCHarXiv CS.CL·vor 4T

Predict and Reconstruct: Joint Objectives for Self-Supervised Language Representation Learning

Dieser Artikel stellt ein hybrides Vor-Trainingsziel für Text-Encoder vor, das einen JEPA-ähnlichen Verlust für die Vorhersage im latenten Raum mit einem Standard-Masked Language Modelling (MLM)-Ziel kombiniert. Dieser neue Ansatz zielt darauf ab, Repräsentationen zu fördern, die an tiefere semantische Strukturen gebunden sind, anstatt nur an die oberflächliche Token-Identität, und zeigt deutlich uniformere Embeddings.

30
RESEARCHarXiv CS.CL·4/14/2026

GIANTS: Generative Insight Anticipation from Scientific Literature

Dieses Papier stellt „Insight Anticipation“ vor, eine neuartige Aufgabe, bei der Sprachmodelle die Kernaussage eines zukünftigen wissenschaftlichen Artikels aus seinen grundlegenden Vorgängern vorhersagen. Zur Evaluierung dieser Fähigkeit entwickelten die Autoren GiantsBench, einen Benchmark mit 17.000 Beispielen, und stellen GIANTS-4B vor, ein mit Reinforcement Learning trainiertes Sprachmodell.

30
RESEARCHDEV.to AI·4/13/2026

Beyond the 80/20 Rule: High-Entropy Minority Tokens Drive EffectiveReinforcement Learning for LLM Reasoning

Dieser Inhalt untersucht einen neuartigen Ansatz zur Verbesserung des Reinforcement Learnings für die Argumentation von Großen Sprachmodellen (LLM) durch die Konzentration auf „high-entropy minority tokens“. Es wird vorgeschlagen, dass diese selteneren, aber hoch informativen Token Schlüsselfaktoren für effektives Lernen sind und die konventionelle 80/20-Regel in Frage stellen.

29
DOCDEV.to AI·4/15/2026

Clide

Clide ist ein Tool mit einer KI-Engine, die Befehlsvorschläge, Code-Vervollständigung und Fehlererkennung in Terminals bietet. Es nutzt Machine-Learning-Frameworks wie TensorFlow/PyTorch und NLP-Bibliotheken wie NLTK/spaCy, um Benutzerinteraktionen zu verarbeiten und zu verstehen.

29
ARTICLEDEV.to AI·vor 27T

Everything Google announced at its Android Show, from Googlebooks to vibe-coded widgets

Der Artikel analysiert technisch die Ankündigungen der Google Android Show, insbesondere die neue Google Books App und die Stimmungs-kodierten Widgets. Es wird detailliert beschrieben, wie Google Books eine proprietäre Rendering-Engine mit ML zur Texterkennung nutzt und wie Widgets NLP sowie Computer Vision über TensorFlow Lite für personalisierte Erlebnisse einsetzen.

29