NLP

124 items

RESEARCHarXiv CS.CL·il y a 5j

Discourse-Role Labels as Presentation-Time Variables for Context Use in Language Models

Cette étude examine l'effet des étiquettes de rôle discursif, telles que "Référence" ou "Instruction", sur le comportement des modèles linguistiques. Elle révèle que le taux d'adoption d'informations trompeuses peut varier considérablement (56 à 84 points de pourcentage) selon l'étiquette, les étiquettes comme "Instruction" augmentant l'adoption et "Exemple" la supprimant systématiquement.

language models Context NLP model behavior

RESEARCHarXiv CS.CL·il y a 5j

ACAT: A Collaborative Platform for Efficient Aspect-Based Sentiment Dataset Annotation

Cet article présente ACAT, une plateforme web collaborative pour l'annotation efficace des ensembles de données d'Analyse des Sentiments Basée sur les Aspects (ABSA). L'outil automatise la consolidation des annotations et le calcul des métriques d'accord inter-annotateurs, prenant en charge quatre flux de travail ABSA.

NLP Dataset Annotation sentiment analysis AI tools

ARTICLEDEV.to AI·10/04/2026

"Attention Is All You Need" Paper tahun 2017 yang mengubah dunia kecerdasan buatan, dijelaskan tanpa perlu latar belakang teknis.

O artigo explora a importância do paper 'Attention Is All You Need' de 2017, que revolucionou a IA ao introduzir a arquitetura Transformer, base de modelos como ChatGPT. Ele detalha como essa inovação superou as limitações das redes neurais recorrentes, permitindo que computadores compreendam e gerem linguagem humana com maior eficiência.

Attention Is All You Need Transformer ChatGPT NLP

ARTICLEDEV.to AI·il y a 18j

Playing with Words at the National Library of Sweden -- Making a Swedish BERT

L'article aborde le processus de création d'un modèle BERT pour la langue suédoise, un projet développé à la Bibliothèque nationale de Suède. L'objectif est d'améliorer le traitement du langage naturel pour le suédois.

language models BERT NLP National Library

DOCDEV.to AI·il y a 23j

Loova Agents

Loova Agents est une plateforme d'IA conversationnelle conçue pour automatiser le support client et l'engagement, tirant parti de l'apprentissage automatique et du traitement du langage naturel. Son architecture basée sur des microservices comprend des composants clés tels qu'un moteur PNL pour comprendre l'entrée du client et la gestion du dialogue pour élaborer des réponses appropriées.

microservices machine learning NLP customer support

RESEARCHarXiv CS.CL·09/04/2026

Depression Detection at the Point of Care: Automated Analysis of Linguistic Signals from Routine Primary Care Encounters

Esta pesquisa explora a detecção automatizada de depressão em consultas de atenção primária, analisando sinais linguísticos de áudios gravados. O estudo compara modelos de IA como GPT-OSS, Sentence-BERT e LIWC+LR, destacando o melhor desempenho do GPT-OSS e a importância das transcrições conjuntas entre médico e paciente.

depression detection Primary Care machine learning NLP

ARTICLEDEV.to AI·10/04/2026

AI21 Labs — Deep Dive

AI21 Labs é uma empresa israelense de IA e produto, um player significativo no espaço de IA generativa, competindo com gigantes como OpenAI. A empresa escalou seus modelos de linguagem de 1.5 bilhões para até 398 bilhões de parâmetros, oferecendo produtos como o assistente de escrita Wordtune e o modelo de contexto longo Jamba.

NLP AI products large language models AI21 Labs

RESEARCHarXiv CS.CL·il y a 21j

Beyond Sentiment Classification: A Generative Framework for Emotion Intensity Evaluation in Text

Ce travail introduit une nouvelle approche de la modélisation des émotions, passant de la classification discrète à l'évaluation continue de l'intensité émotionnelle dans le texte. Les auteurs ont construit un ensemble de données de scores d'intensité émotionnelle et ont affiné des modèles de langage génératifs pour produire des valeurs continues de 0 à 100, surpassant les modèles de classification et démontrant des capacités de généralisation.

emotion modeling Finance NLP sentiment analysis

DOCDEV.to AI·il y a 5j

A surprisingly effective lightweight sentiment analysis approach for product reviews in Python

Ce contenu décrit une approche légère et étonnamment efficace basée sur le lexique pour l'analyse des sentiments des avis sur les produits en Python. Cette technique simple s'est avérée utile pour la détection précoce des sentiments positifs/négatifs, le prototypage et le filtrage en masse avant de passer à des modèles plus avancés basés sur les transformateurs.

learning machine learning NLP sentiment analysis

ARTICLEDEV.to AI·il y a 21j

Mastering the Art of Conversation: Expert ChatGPT Tips and Tricks

Cet article explore des astuces et des conseils d'experts pour maîtriser ChatGPT, le chatbot IA révolutionnaire d'OpenAI. Il discute de la compréhension de ses capacités et limitations pour exploiter pleinement son potentiel dans les conversations et diverses applications.

learning ChatGPT NLP AI

DOCDEV.to AI·17/04/2026

Understanding Transformers Part 9: Stacking Self-Attention Layers

Cet article explique pourquoi les valeurs d'auto-attention remplacent les encodages positionnels originaux, car elles intègrent des informations contextuelles de tous les mots, clarifiant les relations. Il introduit ensuite l'empilement de plusieurs couches d'auto-attention, chacune avec des poids uniques, pour capturer des relations linguistiques plus complexes au sein des phrases et des paragraphes.

neural networks Self-Attention deep learning NLP

DOCDEV.to AI·il y a 25j

2026 NLP Data Collection Guide: How Proxy Networks Improve Large-Scale Data Crawling Efficiency

La collecte de données PNL est essentielle au développement de systèmes d'IA, tels que les LLM et les chatbots. La collecte à grande échelle est confrontée à des défis tels que les systèmes anti-bot et le blocage d'IP, que les réseaux de proxy peuvent atténuer.

Proxy Networks NLP AI Systems web-scraping

RESEARCHarXiv CS.CL·04/05/2026

NorBERTo: A ModernBERT Model Trained for Portuguese with 331 Billion Tokens Corpus

NorBERTo est un nouveau modèle ModernBERT entraîné sur un corpus de 331 milliards de tokens en portugais brésilien (Aurora-PT), conçu pour le support de contexte long et des mécanismes d'attention efficaces. Il obtient les meilleurs résultats parmi les modèles d'encodeur évalués sur des tâches de similarité sémantique, d'inférence textuelle et de classification en utilisant des ensembles de données tels qu'ASSIN 2 et PLUE.

AI models BERT Portuguese NLP

RESEARCHarXiv CS.CL·15/04/2026

LLMs Struggle with Abstract Meaning Comprehension More Than Expected

Cette recherche examine la capacité des LLM à comprendre les significations abstraites, montrant que des modèles comme GPT-4o rencontrent des difficultés en zero-shot, one-shot et few-shot, contrairement aux modèles affinés comme BERT et RoBERTa. Elle propose un classifieur d'attention bidirectionnelle qui améliore considérablement la précision des modèles affinés dans l'interprétation des concepts abstraits.

LLMs GPT-4o NLP abstract meaning comprehension

DOCAWS Machine Learning Blog·il y a 19j

Build AI-powered dashboard automation agents with NLP on Amazon Bedrock AgentCore

Cette solution permet de construire et d'exploiter des agents d'automatisation de tableaux de bord alimentés par l'IA, en utilisant Amazon Bedrock AgentCore, Strands Agents et Amazon Quick transforms. Elle offre un système sécurisé, évolutif et intelligent pour transformer les données en informations commerciales exploitables.

NLP Data transformation Amazon Bedrock automation

RESEARCHarXiv CS.CL·il y a 27j

Instructions shape Production of Language, not Processing

Cet article de recherche explore un mécanisme centré sur la production dans les modèles de langage, révélant une asymétrie entre le traitement et la production du langage. Il montre que les instructions façonnent significativement l'information dans les tokens de sortie, mais pas dans les tokens d'échantillon, avec une forte corrélation avec le comportement du modèle.

language models cognitive science NLP AI Research

CASEDEV.to AI·il y a 15j

The Inexcusable Silence of a Well-Configured AI Treasure Hunt Engine

L'article décrit les défis rencontrés par les opérateurs de Veltrix lors du développement d'un jeu de chasse au trésor alimenté par l'IA, notamment en raison de la priorisation des algorithmes d'IA par rapport à la mécanique du jeu. Cette décision a entraîné d'importants problèmes de débogage liés à des API mal configurées et une intégration incomplète des données, résolus par une refonte majeure de leur stratégie de configuration et de déploiement.

game development kubernetes NLP system architecture

RESEARCHarXiv CS.CL·06/04/2026

Pragmatics Meets Culture: Culturally-adapted Artwork Description Generation and Evaluation

Este artigo apresenta a tarefa de geração de descrições de arte culturalmente adaptadas para combater o viés cultural em modelos de linguagem na geração de texto aberto. Ele propõe um framework de avaliação baseado em perguntas e respostas culturalmente fundamentadas, mostrando que um modelo de locutor pragmático melhora significativamente a compreensão do ouvinte.

Art Description language models evaluation Pragmatics

RESEARCHarXiv CS.CL·il y a 15j

A Survey of Text and Speech Resources for Hausa and Fongbe: Availability, Quality, and Gaps for NLP Development

Cette étude catalogue les ressources textuelles et orales publiquement disponibles pour le haoussa et le fongbe, deux langues d'Afrique de l'Ouest, afin d'évaluer leur état actuel et d'identifier les lacunes pour le développement du PNL. Elle documente systématiquement diverses ressources, constatant que le haoussa bénéficie d'une plus grande diversité de ressources textuelles par rapport au fongbe.

African languages Fongbe NLP Hausa

RESEARCHDEV.to AI·12/04/2026

ACUTE-EVAL: Improved Dialogue Evaluation with Optimized Questions and Multi-turnComparisons

Le titre présente ACUTE-EVAL, une méthode pour améliorer l'évaluation des systèmes de dialogue. Il se concentre sur l'optimisation des questions et des comparaisons multi-tours pour une analyse plus précise de la qualité conversationnelle de l'IA.

ACUTE-EVAL IA Conversacional NLP Avaliação de Diálogo