NLP

124 items

RESEARCHarXiv CS.CL·vor 5T

Discourse-Role Labels as Presentation-Time Variables for Context Use in Language Models

Diese Studie untersucht den Einfluss von Diskursrollen-Etiketten wie "Referenz" oder "Anweisung" auf das Verhalten von Sprachmodellen. Es zeigt sich, dass sich die Adoptionsrate irreführender Informationen je nach Etikett erheblich verschieben kann (56-84 Prozentpunkte), wobei Etiketten wie "Anweisung" die Adoption erhöhen und "Beispiel" sie konstant unterdrückt.

language models Context NLP model behavior

RESEARCHarXiv CS.CL·vor 5T

ACAT: A Collaborative Platform for Efficient Aspect-Based Sentiment Dataset Annotation

Dieser Artikel stellt ACAT vor, eine kollaborative webbasierte Plattform zur effizienten Annotation von Aspect-Based Sentiment Analysis (ABSA)-Datensätzen. Das Tool automatisiert die Konsolidierung von Annotationen und die Berechnung von Inter-Annotator Agreement-Metriken, wobei es vier ABSA-Workflows unterstützt.

NLP Dataset Annotation sentiment analysis AI tools

ARTICLEDEV.to AI·4/10/2026

"Attention Is All You Need" Paper tahun 2017 yang mengubah dunia kecerdasan buatan, dijelaskan tanpa perlu latar belakang teknis.

O artigo explora a importância do paper 'Attention Is All You Need' de 2017, que revolucionou a IA ao introduzir a arquitetura Transformer, base de modelos como ChatGPT. Ele detalha como essa inovação superou as limitações das redes neurais recorrentes, permitindo que computadores compreendam e gerem linguagem humana com maior eficiência.

Attention Is All You Need Transformer ChatGPT NLP

ARTICLEDEV.to AI·vor 18T

Playing with Words at the National Library of Sweden -- Making a Swedish BERT

Der Artikel befasst sich mit der Entwicklung eines BERT-Modells für die schwedische Sprache, einem Projekt, das an der Schwedischen Nationalbibliothek durchgeführt wurde. Ziel ist es, die Verarbeitung natürlicher Sprache für Schwedisch zu verbessern.

language models BERT NLP National Library

DOCDEV.to AI·vor 23T

Loova Agents

Loova Agents ist eine konversationelle KI-Plattform zur Automatisierung des Kundensupports und der Kundenbindung, die maschinelles Lernen und natürliche Sprachverarbeitung nutzt. Ihre mikroservicebasierte Architektur umfasst Schlüsselkomponenten wie eine NLP-Engine zum Verstehen von Kundeneingaben und ein Dialogmanagement zur Erstellung passender Antworten.

microservices machine learning NLP customer support

RESEARCHarXiv CS.CL·4/9/2026

Depression Detection at the Point of Care: Automated Analysis of Linguistic Signals from Routine Primary Care Encounters

Esta pesquisa explora a detecção automatizada de depressão em consultas de atenção primária, analisando sinais linguísticos de áudios gravados. O estudo compara modelos de IA como GPT-OSS, Sentence-BERT e LIWC+LR, destacando o melhor desempenho do GPT-OSS e a importância das transcrições conjuntas entre médico e paciente.

depression detection Primary Care machine learning NLP

ARTICLEDEV.to AI·4/10/2026

AI21 Labs — Deep Dive

AI21 Labs é uma empresa israelense de IA e produto, um player significativo no espaço de IA generativa, competindo com gigantes como OpenAI. A empresa escalou seus modelos de linguagem de 1.5 bilhões para até 398 bilhões de parâmetros, oferecendo produtos como o assistente de escrita Wordtune e o modelo de contexto longo Jamba.

NLP AI products large language models AI21 Labs

RESEARCHarXiv CS.CL·vor 21T

Beyond Sentiment Classification: A Generative Framework for Emotion Intensity Evaluation in Text

Diese Arbeit stellt einen neuartigen Ansatz zur Emotionsmodellierung vor, der von der diskreten Klassifizierung zur kontinuierlichen Bewertung der Emotionsintensität in Texten übergeht. Die Autoren erstellten einen Datensatz von emotionalen Intensitätswerten und optimierten generative Sprachmodelle, um kontinuierliche Werte von 0-100 auszugeben, was Klassifizierungs-Baselines übertrifft und Generalisierungsfähigkeiten aufzeigt.

emotion modeling Finance NLP sentiment analysis

DOCDEV.to AI·vor 5T

A surprisingly effective lightweight sentiment analysis approach for product reviews in Python

Dieser Inhalt beschreibt einen überraschend effektiven, leichtgewichtigen, lexikonbasierten Ansatz zur Stimmungsanalyse von Produktbewertungen in Python. Die einfache Technik erwies sich als nützlich für die frühzeitige Erkennung positiver/negativer Stimmungen, Prototyping und Massenfilterung, bevor fortgeschrittenere Transformer-basierte Modelle eingesetzt wurden.

learning machine learning NLP sentiment analysis

ARTICLEDEV.to AI·vor 21T

Mastering the Art of Conversation: Expert ChatGPT Tips and Tricks

Dieser Artikel bietet Expertentipps und Tricks zur Beherrschung von ChatGPT, dem revolutionären KI-Chatbot von OpenAI. Er behandelt das Verständnis seiner Fähigkeiten und Einschränkungen, um sein volles Potenzial in Gesprächen und verschiedenen Anwendungen freizuschalten.

learning ChatGPT NLP AI

DOCDEV.to AI·4/17/2026

Understanding Transformers Part 9: Stacking Self-Attention Layers

Dieser Artikel erklärt, warum Selbstaufmerksamkeitswerte die ursprünglichen Positional Encodings ersetzen, da sie kontextuelle Informationen aller Wörter integrieren und Beziehungen verdeutlichen. Anschließend wird das Stapeln mehrerer Selbstaufmerksamkeitsschichten, jeweils mit einzigartigen Gewichten, vorgestellt, um komplexere sprachliche Beziehungen innerhalb von Sätzen und Absätzen zu erfassen.

neural networks Self-Attention deep learning NLP

DOCDEV.to AI·vor 25T

2026 NLP Data Collection Guide: How Proxy Networks Improve Large-Scale Data Crawling Efficiency

Die NLP-Datenerfassung ist entscheidend für die Entwicklung von KI-Systemen wie LLMs und Chatbots. Die groß angelegte Erfassung steht vor Herausforderungen wie Anti-Bot-Systemen und IP-Sperren, die durch Proxy-Netzwerke gemindert werden können.

Proxy Networks NLP AI Systems web-scraping

RESEARCHarXiv CS.CL·5/4/2026

NorBERTo: A ModernBERT Model Trained for Portuguese with 331 Billion Tokens Corpus

NorBERTo ist ein neues ModernBERT-Modell, das mit einem 331 Milliarden Token umfassenden brasilianischen Portugiesisch-Korpus (Aurora-PT) trainiert wurde und für Langkontextunterstützung und effiziente Aufmerksamkeitsmechanismen entwickelt wurde. Es erzielt die besten Ergebnisse unter den evaluierten Encoder-Modellen bei Aufgaben der semantischen Ähnlichkeit, textuellen Implikation und Klassifizierung unter Verwendung von Datensätzen wie ASSIN 2 und PLUE.

AI models BERT Portuguese NLP

RESEARCHarXiv CS.CL·4/15/2026

LLMs Struggle with Abstract Meaning Comprehension More Than Expected

Diese Forschung untersucht die Fähigkeit von LLMs, abstrakte Bedeutungen zu erfassen, und zeigt, dass Modelle wie GPT-4o in Zero-Shot-, One-Shot- und Few-Shot-Szenarien Schwierigkeiten haben, während feinabgestimmte Modelle wie BERT und RoBERTa besser abschneiden. Sie schlägt einen bidirektionalen Aufmerksamkeitsklassifikator vor, der die Genauigkeit feinabgestimmter Modelle bei der Interpretation abstrakter Konzepte erheblich verbessert.

LLMs GPT-4o NLP abstract meaning comprehension

DOCAWS Machine Learning Blog·vor 19T

Build AI-powered dashboard automation agents with NLP on Amazon Bedrock AgentCore

Diese Lösung ermöglicht den Aufbau und Betrieb von KI-gesteuerten Dashboard-Automatisierungsagenten unter Verwendung von Amazon Bedrock AgentCore, Strands Agents und Amazon Quick transforms. Sie bietet ein sicheres, skalierbares und intelligentes System zur Umwandlung von Daten in umsetzbare Geschäftseinblicke.

NLP Data transformation Amazon Bedrock automation

RESEARCHarXiv CS.CL·vor 27T

Instructions shape Production of Language, not Processing

Diese Forschungsarbeit untersucht einen produktionszentrierten Mechanismus in Sprachmodellen und offenbart eine Asymmetrie zwischen Sprachverarbeitung und -produktion. Sie zeigt, dass Anweisungen die Informationen in Ausgabetoken, aber nicht in Eingabetoken, erheblich formen und stark mit dem Modellverhalten korrelieren.

language models cognitive science NLP AI Research

CASEDEV.to AI·vor 15T

The Inexcusable Silence of a Well-Configured AI Treasure Hunt Engine

Der Artikel beschreibt die Herausforderungen, mit denen Veltrix-Betreiber bei der Entwicklung eines KI-gestützten Schatzsuchspiels konfrontiert waren, insbesondere aufgrund der Priorisierung von KI-Algorithmen gegenüber der Spielmechanik. Diese Entscheidung führte zu erheblichen Debugging-Problemen im Zusammenhang mit falsch konfigurierten APIs und unvollständiger Datenintegration, die durch eine drastische Überarbeitung ihrer Konfigurations- und Bereitstellungsstrategie gelöst wurden.

game development kubernetes NLP system architecture

RESEARCHarXiv CS.CL·4/6/2026

Pragmatics Meets Culture: Culturally-adapted Artwork Description Generation and Evaluation

Este artigo apresenta a tarefa de geração de descrições de arte culturalmente adaptadas para combater o viés cultural em modelos de linguagem na geração de texto aberto. Ele propõe um framework de avaliação baseado em perguntas e respostas culturalmente fundamentadas, mostrando que um modelo de locutor pragmático melhora significativamente a compreensão do ouvinte.

Art Description language models evaluation Pragmatics

RESEARCHarXiv CS.CL·vor 15T

A Survey of Text and Speech Resources for Hausa and Fongbe: Availability, Quality, and Gaps for NLP Development

Diese Studie katalogisiert öffentlich verfügbare Text- und Sprachressourcen für Hausa und Fongbe, zwei westafrikanische Sprachen, um deren aktuellen Stand zu bewerten und Lücken für die NLP-Entwicklung zu identifizieren. Sie dokumentiert systematisch verschiedene Ressourcen und stellt fest, dass Hausa von einer breiteren Textvielfalt im Vergleich zu Fongbe profitiert.

African languages Fongbe NLP Hausa

RESEARCHDEV.to AI·4/12/2026

ACUTE-EVAL: Improved Dialogue Evaluation with Optimized Questions and Multi-turnComparisons

Der Titel stellt ACUTE-EVAL vor, eine Methode zur Verbesserung der Evaluierung von Dialogsystemen. Sie konzentriert sich auf die Optimierung von Fragen und mehrstufigen Vergleichen für eine präzisere Analyse der Qualität von Konversations-KI.

ACUTE-EVAL IA Conversacional NLP Avaliação de Diálogo