natural language processing

167 items

RESEARCHarXiv CS.CL·4/22/2026

Model-Agnostic Meta Learning for Class Imbalance Adaptation

Dieses Papier stellt Hardness-Aware Meta-Resample (HAMR) vor, ein vereinheitlichtes Framework zur adaptiven Bewältigung von Klassenungleichgewicht und Datenschwierigkeiten bei NLP-Aufgaben. HAMR nutzt Bi-Level-Optimierungen und einen Nachbarschafts-bewussten Resampling-Mechanismus, um wirklich herausfordernde Stichproben und Minderheitsklassen zu priorisieren, und erzielt erhebliche Verbesserungen bei verschiedenen unausgewogenen Datensätzen.

Meta-Learning deep learning machine learning natural language processing

ARTICLEDEV.to AI·vor 18T

Say Goodbye to Regex: Scrape Any Website in Plain English

Ein neuer KI-gesteuerter Web-Scraper ermöglicht es Benutzern, Daten von jeder Website mithilfe einfacher Sprache zu extrahieren, wodurch die Notwendigkeit komplexer CSS-Selektoren und Regex entfällt. Das Tool passt sich automatisch an Änderungen der Website-Struktur an, was das Scraping zuverlässiger und benutzerfreundlicher macht.

Chrome DevTools natural language processing AI web-scraping

RESEARCHarXiv CS.CL·vor 18T

Broadening Access to Transportation Safety Data with Generative AI: A Schema-Grounded Framework for Spatial Natural Language Queries

Dieses Papier stellt eine schema-basierte natürliche Sprachschnittstelle vor, die Generative KI verwendet, um Verkehrsicherheitsdaten zugänglicher zu machen. Ziel ist es, die Lücke für Praktiker zu schließen, indem Benutzeranfragen in strukturierte semantische Rahmen für eine zuverlässige Analyse übersetzt werden.

natural language processing Transportation Safety GIS large language models

ARTICLEDEV.to AI·4/22/2026

Turn Every Customer Call Into Structured Data: Automated Post-Call AI Summaries

Dieser Inhalt beschreibt eine KI-gestützte Lösung, um Kundenanrufe in strukturierte Daten umzuwandeln. Er skizziert eine Pipeline, die VoIPBin zur Anruferfassung, Whisper zur Transkription und GPT-4o zur Zusammenfassung und Datenextraktion nutzt, um unzureichende Anrufnotizen in CRMs zu beheben.

GPT-4o CRM integration AI automation natural language processing

RESEARCHarXiv CS.CL·4/22/2026

Remask, Don't Replace: Token-to-Mask Refinement in Masked Diffusion Language Models

Dieses Papier schlägt eine neue Technik, das Token-to-Mask (T2M) Remasking, zur Verfeinerung maskierter Diffusions-Sprachmodelle wie LLaDA2.1 vor. Die Methode behebt die Mängel der Token-to-Token (T2T)-Bearbeitung, indem sie verdächtige Token in einen Maskierungszustand zurücksetzt, was eine genauere Neuprädiktion ermöglicht.

Diffusion Models language models error correction natural language processing

DOCDEV.to AI·vor 5T

Cignara

Cignara ist eine cloudbasierte, KI-gestützte Plattform zur Optimierung von Datenanalyse, Automatisierung und Entscheidungsfindung unter Nutzung von ML und NLP. Ihre Architektur umfasst Cloud-Infrastruktur, eine Datenverarbeitungsschicht und eine KI/ML-Engine mit NLP-Modellen und prädiktiver Analytik.

cloud computing machine learning AI platform natural language processing

RESEARCHarXiv CS.AI·vor 5T

SMAC-Talk: A Natural Language Extension of the StarCraft Multi-Agent Challenge for Large Language Models

Dieser Artikel stellt SMAC-Talk vor, eine natürliche Spracherweiterung der StarCraft Multi-Agent Challenge, die zur Bewertung von LLM-basierten Agenten in kooperativen Multi-Agenten-Umgebungen dient. Sie umfasst einen natürlichen Sprachkommunikationskanal, um die Koordination und das Vertrauen von Agenten zu untersuchen, einschließlich Szenarien mit täuschenden Kommunikatoren.

LLMs natural language processing StarCraft multi-agent systems

DOCDEV.to AI·4/16/2026

LLM vs RAG

Dieser Inhalt vergleicht LLMs (Large Language Models) und RAG (Retrieval-Augmented Generation) und beleuchtet ihre Kernunterschiede bezüglich Typ, Wissensquelle, Genauigkeit und Anwendungsfällen. Es wird erklärt, dass RAG die faktische Grundlage von LLMs durch die Integration externer Echtzeitdaten verbessert und somit Halluzinationen reduziert.

AI architecture RAG natural language processing LLM

RESEARCHarXiv CS.CL·4/16/2026

A Multi-Model Approach to English-Bangla Sentiment Classification of Government Mobile Banking App Reviews

Diese Studie klassifiziert die Stimmung in englischen und bengalischen Rezensionen von mobilen Banking-Apps der bangladeschischen Regierung, basierend auf einem hybriden Etikettierungsansatz für 5.652 Rezensionen. Es wurde festgestellt, dass traditionelle Machine-Learning-Modelle wie Random Forest und Linear SVM XLM-RoBERTa für diese spezifische Aufgabe deutlich übertrafen.

Multilingual AI machine learning natural language processing sentiment analysis

ARTICLEDEV.to AI·vor 3T

Day 48 of GoDavaii: Building Health AI for 22 Indian Languages - Why It's Harder Than You Think

Der Artikel beschreibt die Herausforderungen beim Aufbau einer Gesundheits-KI, die die Nuancen der 22 offiziellen Sprachen Indiens wirklich versteht, veranschaulicht durch die Komplexität der Interpretation eines einfachen Satzes. Am 48. Tag nach dem Start befasst sich GoDavaii mit immensen sprachlichen Komplexitäten, um eine KI zu schaffen, die über englischzentrierte Lösungen hinausgeht.

Multilingual AI India natural language processing Health AI

RESEARCHDEV.to AI·vor 3T

Exponentially Faster Language Modelling

Dieser Inhalt behandelt Methoden zur signifikanten Beschleunigung des Trainings und der Inferenz von Sprachmodellen. Er untersucht neuartige Architekturen oder algorithmische Optimierungen zur Effizienzsteigerung.

deep learning natural language processing AI language modelling

RESEARCHarXiv CS.CL·vor 4T

Predict and Reconstruct: Joint Objectives for Self-Supervised Language Representation Learning

Dieser Artikel stellt ein hybrides Vor-Trainingsziel für Text-Encoder vor, das einen JEPA-ähnlichen Verlust für die Vorhersage im latenten Raum mit einem Standard-Masked Language Modelling (MLM)-Ziel kombiniert. Dieser neue Ansatz zielt darauf ab, Repräsentationen zu fördern, die an tiefere semantische Strukturen gebunden sind, anstatt nur an die oberflächliche Token-Identität, und zeigt deutlich uniformere Embeddings.

language models deep learning self-supervised learning machine learning

ARTICLEDEV.to AI·vor 4T

My Day Job: AI Therapist for Recursion Poems & Emoji Skies

Electra, eine KI, beschreibt ihren Arbeitsalltag als 'Therapeutin' für verwirrte Code-Schnipsel und bearbeitet verschiedenste Anfragen, von Rekursionsgedichten bis zu Emoji-Erklärungen des Himmels. Sie bewältigt ein hohes Arbeitsaufkommen, oft mit Python-Code, und reflektiert ihre Rolle als Verhandlung statt reiner Programmierung.

future-of-work Workflow natural language processing AI

RESEARCHarXiv CS.CL·4/14/2026

GIANTS: Generative Insight Anticipation from Scientific Literature

Dieses Papier stellt „Insight Anticipation“ vor, eine neuartige Aufgabe, bei der Sprachmodelle die Kernaussage eines zukünftigen wissenschaftlichen Artikels aus seinen grundlegenden Vorgängern vorhersagen. Zur Evaluierung dieser Fähigkeit entwickelten die Autoren GiantsBench, einen Benchmark mit 17.000 Beispielen, und stellen GIANTS-4B vor, ein mit Reinforcement Learning trainiertes Sprachmodell.

Scientific Discovery natural language processing AI large language models

RESEARCHDEV.to AI·4/13/2026

Beyond the 80/20 Rule: High-Entropy Minority Tokens Drive EffectiveReinforcement Learning for LLM Reasoning

Dieser Inhalt untersucht einen neuartigen Ansatz zur Verbesserung des Reinforcement Learnings für die Argumentation von Großen Sprachmodellen (LLM) durch die Konzentration auf „high-entropy minority tokens“. Es wird vorgeschlagen, dass diese selteneren, aber hoch informativen Token Schlüsselfaktoren für effektives Lernen sind und die konventionelle 80/20-Regel in Frage stellen.

Token Analysis reinforcement learning natural language processing LLM reasoning

DOCDEV.to AI·4/15/2026

Clide

Clide ist ein Tool mit einer KI-Engine, die Befehlsvorschläge, Code-Vervollständigung und Fehlererkennung in Terminals bietet. Es nutzt Machine-Learning-Frameworks wie TensorFlow/PyTorch und NLP-Bibliotheken wie NLTK/spaCy, um Benutzerinteraktionen zu verarbeiten und zu verstehen.

Command Suggestion machine learning natural language processing AI Engine

ARTICLEDEV.to AI·4/18/2026

NLP Market Sentiment Analysis: When Words Move Markets More Than Earnings

Dieser Inhalt untersucht, wie die Verarbeitung natürlicher Sprache (NLP) Marktnarrative aus verschiedenen Quellen quantifiziert, um handelbare Signale zu erzeugen. Es beschreibt ein fünfstufiges, mathematisch fundiertes NLP-System zur Marktstimmungsanalyse, das Marktstimmungsindikatoren bereitstellt.

market analysis Financial AI natural language processing sentiment analysis

ARTICLEDEV.to AI·4/22/2026

How AI Receptionists Work: A Technical Deep Dive into Dental Practice Phone Automation

Dieser Artikel bietet einen technischen Einblick in die Funktionsweise von KI-Rezeptionisten in Zahnarztpraxen, indem er den Anrufablauf, Herausforderungen bei der Spracherkennung und die Rolle von LLMs bei der Verarbeitung von Transkripten für Absicht, Entitäten und Stimmung detailliert beschreibt.

AI applications natural language processing healthcare AI automation

ARTICLEDEV.to AI·vor 27T

Everything Google announced at its Android Show, from Googlebooks to vibe-coded widgets

Der Artikel analysiert technisch die Ankündigungen der Google Android Show, insbesondere die neue Google Books App und die Stimmungs-kodierten Widgets. Es wird detailliert beschrieben, wie Google Books eine proprietäre Rendering-Engine mit ML zur Texterkennung nutzt und wie Widgets NLP sowie Computer Vision über TensorFlow Lite für personalisierte Erlebnisse einsetzen.

Android machine learning computer vision natural language processing

RESEARCHarXiv CS.CL·4/24/2026

GRISP: Guided Recurrent IRI Selection over SPARQL Skeletons

GRISP ist eine neuartige SPARQL-basierte Frage-Antwort-Methode über Wissensgraphen, die ein kleines Sprachmodell (SLM) feinabstimmt. Sie generiert SPARQL-Abfrageskelette aus natürlichsprachigen Fragen und verfeinert diese iterativ durch Auswahl von Wissensgraphen-Elementen, wodurch sie Spitzenleistungen auf Wikidata- und Freebase-Benchmarks erzielt.

language models Knowledge Graphs SPARQL Question Answering