Natural Language Processing

168 items

ARTICLEDEV.to AI·4/24/2026

GoDavaii's Day 5: When 22 Indian Languages Redefine 'Hard' in Health AI

GoDavaii stellt sich der technologischen Herausforderung der Gesundheits-KI in Indien und konzentriert sich auf das Verständnis von Gesundheitsbeschreibungen in 22 lokalen Sprachen mit ihren kulturellen Nuancen. Das Unternehmen betont, dass die Interpretation kulturell spezifischer Gesundheitsausdrücke viel komplexer ist als die direkte Übersetzung, eine Herausforderung, die globale Gesundheits-KIs oft übersehen.

Multilingual AI India AI in healthcare Natural Language Processing

RESEARCHDEV.to AI·4/26/2026

Multi-Perspective Context Matching for Machine Comprehension

Dieser Inhalt befasst sich mit einer innovativen Multi-Perspektiv-Kontextabgleichsmethode zur Verbesserung des maschinellen Verständnisses. Die Technik zielt darauf ab, die Fähigkeit von KI-Systemen zu verbessern, komplexe Texte durch die Analyse von Informationen aus verschiedenen Blickwinkeln zu verstehen.

Context Matching Natural Language Processing Machine Comprehension

ARTICLEDEV.to AI·4/27/2026

Building Smart Student Engagement Detector: An AI-Powered Early Learning Issue Detection System using ML, NLP & Multimodal Analytics

Dieses Projekt beschreibt ein KI-gestütztes System zur Erkennung des studentischen Engagements, das ML, NLP und multimodale Analysen nutzt, um frühe Anzeichen von Lernschwierigkeiten zu identifizieren. Ziel ist es, einzugreifen, bevor akademische, Anwesenheits- oder Verhaltensprobleme eskalieren und sich in den Noten widerspiegeln.

Multimodal Analytics education machine learning Natural Language Processing

RESEARCHarXiv CS.AI·vor 21T

From Prompts to Protocols: An AI Agent for Laboratory Automation

Dieser Artikel stellt eine KI-Agentenarchitektur vor, die große Sprachmodelle mit Labororchestration integriert. Sie ermöglicht Wissenschaftlern, automatisierte Laborprotokolle interaktiv mittels natürlicher Sprache zu erstellen und zu überwachen.

Experiment Orchestration AI agent Natural Language Processing large language models

RESEARCHarXiv CS.AI·4/7/2026

Towards the AI Historian: Agentic Information Extraction from Primary Sources

Este relatório técnico apresenta o primeiro módulo de Chronos, um Historiador de IA em desenvolvimento. Ele permite que historiadores convertam imagens digitalizadas de fontes primárias em dados através de interações em linguagem natural, adaptando e refinando fluxos de trabalho.

Open Source Information Extraction Natural Language Processing AI

RESEARCHarXiv CS.CL·4/7/2026

Text Summarization With Graph Attention Networks

Este estudo explorou o uso de informações de grafos (RST e Co-referência) para sumarização de texto, descobrindo que Redes de Atenção Gráficas não melhoraram o desempenho, enquanto um Perceptron Multicamadas obteve sucesso. Adicionalmente, foi criado um novo benchmark para sumarização baseada em grafos ao anotar o dataset XSum com informações RST.

Graph Attention Networks Rhetorical Structure Theory machine learning Natural Language Processing

RESEARCHarXiv CS.LG·4/6/2026

SIEVE: Sample-Efficient Parametric Learning from Natural Language

SIEVE propõe um método para aprendizado paramétrico com eficiência de amostra a partir de contexto de linguagem natural, necessitando de apenas três exemplos de consulta. Ele emprega uma pipeline de geração de dados sintéticos, SIEVE-GEN, que decompõe o contexto para gerar resultados de maior qualidade e destilar o contexto no modelo.

language models Sample Efficiency contextual learning machine learning

RESEARCHarXiv CS.CL·4/6/2026

Speaking of Language: Reflections on Metalanguage Research in NLP

Este trabalho define metalinguagem e explora sua conexão com PNL e LLMs, discutindo esforços de pesquisa e dimensões de tarefas metalinguísticas. Propõe ainda uma lista de futuras direções de pesquisa pouco estudadas.

LLMs research Metalanguage NLP

RESEARCHarXiv CS.AI·4/23/2026

Algorithm Selection with Zero Domain Knowledge via Text Embeddings

Der Artikel stellt ZeroFolio vor, einen feature-freien Algorithmus-Auswahlansatz, der vortrainierte Text-Embeddings von Rohinstanzdateien verwendet. Diese Methode, die kein Domänenwissen erfordert, übertrifft traditionelle Ansätze mit handgefertigten Features in den meisten bewerteten Szenarien über verschiedene Problemdomänen hinweg.

machine learning Natural Language Processing algorithm selection zero-shot learning

RESEARCHarXiv CS.AI·4/23/2026

Automated Detection of Dosing Errors in Clinical Trial Narratives: A Multi-Modal Feature Engineering Approach with LightGBM

Diese Forschung stellt ein automatisiertes System zur Erkennung von Dosierungsfehlern in klinischen Studienberichten vor, das LightGBM mit umfassendem Multi-Modal-Feature-Engineering nutzt. Der Ansatz kombiniert traditionelles NLP, semantische Embeddings, medizinische Muster und Transformer-Scores, um eine hohe ROC-AUC auf einem unausgewogenen Datensatz zu erzielen.

machine learning Natural Language Processing healthcare AI

RESEARCHarXiv CS.AI·4/23/2026

Exploring Data Augmentation and Resampling Strategies for Transformer-Based Models to Address Class Imbalance in AI Scoring of Scientific Explanations in NGSS Classroom

Diese Studie untersucht Datenaugmentierungsstrategien zur Verbesserung der auf Transformatoren basierenden Textklassifikation für die automatisierte Bewertung wissenschaftlicher Erklärungen von Schülern, um das Problem der Klassenungleichheit anzugehen. Sie bewertet Methoden wie von GPT-4 generierte Antworten, EASE und ALP im Vergleich zu einer SciBERT-Baseline, basierend auf einem Datensatz von 1.466 High-School-Antworten.

machine learning Natural Language Processing education technology Data Augmentation

RESEARCHarXiv CS.CL·5/6/2026

MedStruct-S: A Benchmark for Key Discovery, Key-Conditioned QA and Semi-Structured Extraction from OCR Clinical Reports

MedStruct-S ist ein neuer Benchmark für die semi-strukturierte Informationsgewinnung aus OCR-abgeleiteten klinischen Berichten, der Herausforderungen wie heterogene Schlüsselrepräsentationen und OCR-Rauschen adressiert. Er zielt darauf ab, die Modellrobustheit in realen Szenarien für die Schlüsselentdeckung, schlüsselkonditionierte QA und die Extraktion von Schlüssel-Wert-Paaren zu bewerten.

Information Extraction clinical reports Benchmarking Natural Language Processing

RESEARCHarXiv CS.CL·5/6/2026

Geometric Deviation as an Unsupervised Pre-Generation Reliability Signal: Probing LLM Representations for Answerability

Diese Forschung untersucht die Verwendung geometrischer Abweichungen von LLM-Hidden-States als Vor-Generierungs-Signal, um anzuzeigen, wann eine Abfrage außerhalb des Wissensbereichs des Modells liegt. Es wurde festgestellt, dass dieses Signal bei unbeantwortbaren mathematischen Prompts gut funktioniert, jedoch nicht bei faktischen Prompts.

LLMs research Model Evaluation Reliability

RESEARCHarXiv CS.CL·5/6/2026

How Language Models Process Negation

Diese Studie untersucht, wie große Sprachmodelle (LLMs) die Negation mechanistisch verarbeiten, und zeigt, dass selbst Open-Weight-Modelle interne Komponenten für die korrekte Negationsverarbeitung besitzen, obwohl sie oft falsche Antworten liefern. Ihre geringe Genauigkeit wird auf die Aufmerksamkeitsleistung späterer Schichten zurückgeführt, die einfache Abkürzungen fördert, und die Modelle nutzen sowohl die Aufmerksamkeit auf negierte Phrasen als auch die direkte Konstruktion negativer Phrasendarstellungen.

LLMs Mechanistic Interpretability attention mechanisms Natural Language Processing

RESEARCHarXiv CS.CL·5/6/2026

S^2tory: Story Spine Distillation for Movie Script Summarization

S^2tory ist ein narratologisch fundiertes KI-Framework zur Zusammenfassung von Filmskripten, das die Komplexität nicht-linearer Erzählstrukturen durch die Identifizierung von "Handlungskernen" mittels Charakterentwicklungstrajektorien adressiert. Es verwendet einen Narrativen Expertenagenten, um Wissen zu destillieren, das dann ein kleines Modell zur Identifizierung wesentlicher Handlungspunkte für die Zusammenfassungsgenerierung konditioniert.

machine learning narrative AI Natural Language Processing summarization

DOCAndrej Karpathy (YouTube)·2/20/2024

Let's build the GPT Tokenizer

Dieser Inhalt bietet eine praktische Anleitung zum Aufbau eines GPT-Tokenizers, in der die grundlegenden Schritte und Konzepte detailliert beschrieben werden. Er erläutert, wie GPT-Modelle Text verarbeiten, indem sie ihn für die Analyse in kleinere Einheiten umwandeln.

GPT learning Natural Language Processing tokenizer

DOCfast.ai Blog·1/20/2026

How To Use AI for the Ancient Art of Close Reading

Dieser Inhalt untersucht, wie künstliche Intelligenz, insbesondere Large Language Models (LLMs), für die alte Kunst des Close Reading eingesetzt werden kann. Er beschreibt Experimente und Ansätze zur Anwendung von KI in dieser traditionellen Kunstform.

text analysis LLMs learning Natural Language Processing

How To Use AI for the Ancient Art of Close Reading

RESEARCHarXiv CS.AI·4/9/2026

BDI-Kit Demo: A Toolkit for Programmable and Conversational Data Harmonization

O BDI-Kit é uma ferramenta que aborda a harmonização de dados, superando a heterogeneidade em esquemas e valores. Ele oferece uma API Python para pipelines programáticos e uma interface de chat assistida por IA para especialistas, permitindo explorar, validar e refinar correspondências de dados de forma iterativa.

Data Harmonization Natural Language Processing AI

ARTICLEDEV.to AI·5/2/2026

The Aunty Test - what Bengali-speaking patients see when they ask Health AI in their own language

Bestehende englischsprachige Gesundheits-KI versagt bei medizinischen Anfragen in Sprachen wie Bengali, was zu unzureichender Beratung führt. Im Gegensatz dazu argumentiert GoDavaii nativ in 22 indischen Sprachen und liefert präzise und kulturell relevante medizinische Ratschläge.

Multilingual AI Healthcare technology AI bias Natural Language Processing

ARTICLEDEV.to AI·5/2/2026

Advances in Multimodal AI: Researchers Develop New Framework for Fusion of Vision and Language

Multimodale KI, die mehrere Datenquellen wie Vision und Sprache integriert, gewinnt aufgrund der zunehmenden Digitalisierung und vielfältiger Anwendungen in verschiedenen Sektoren an Bedeutung. Eine zentrale Herausforderung bleibt jedoch die effektive Fusion unterschiedlicher Datentypen mit verschiedenen Verarbeitungsanforderungen.

multimodal AI computer vision Natural Language Processing