NLP

124 items

ARTICLEDEV.to AI·24/04/2026

Bringing it to Life: The Real-Time Inference Engine (Part 3)

Cet article, partie 3 d'une série, détaille le moteur d'inférence en temps réel pour un projet ASL-vers-voix, abordant le défi du traitement des flux de webcam infinis. Il explique l'architecture de Fenêtre Coulissante pour décoder les points clés du corps en glosses de langue des signes et utiliser des LLMs pour générer de l'anglais parlé.

sign-language machine learning computer vision NLP

RESEARCHDEV.to AI·il y a 24j

Efficient 8-Bit Quantization of Transformer Neural Machine Language TranslationModel

Cet article aborde la quantification efficace sur 8 bits des modèles de traduction automatique Transformer. L'objectif est d'optimiser les performances et l'efficacité de ces modèles en réduisant la consommation de mémoire et la latence.

AI models efficiency NLP quantization

ARTICLEDEV.to AI·09/05/2026

Your RAG can't answer 'why' -- GraphRAG finds what vector search misses

Cet article explore les limites des systèmes RAG (Retrieval-Augmented Generation) conventionnels, qui échouent à répondre aux questions du type « pourquoi » car la recherche vectorielle ne trouve que des documents similaires, et non des documents liés. Il introduit GraphRAG comme une solution pour dépasser ce « plafond structurel » en permettant au système de relier les informations. L'auteur partage une anecdote personnelle sur la frustration de découvrir ce goulot d'étranglement architectural après des tentatives infructueuses de réécrire des prompts.

AI architecture GraphRAG RAG NLP

ARTICLEDEV.to AI·26/04/2026

I Made Two AI Models Read My Git Commits. It Got Uncomfortably Personal.

L'auteur décrit une expérience où deux modèles d'IA ont analysé les messages de commit Git pour déterminer l'humeur du développeur, révélant des aperçus étonnamment personnels. Le défi, un duel aveugle entre Gemini 2.5 Flash et une IA personnalisée, a montré la profondeur de l'analyse des outils.

AI models privacy NLP sentiment analysis

DOCDEV.to AI·20/04/2026

How to integrate DeepSeek R1 into your React app

Ce guide complet détaille l'intégration de DeepSeek R1, une API d'IA axée sur le traitement du langage naturel, dans les applications React, en fournissant des étapes et des meilleures pratiques. Il couvre les prérequis et la communication via des requêtes HTTP avec Axios.

ReAct NLP DeepSeek R1 API Integration

RESEARCHHugging Face Blog·il y a 26j

Granite Embedding Multilingual R2: Open Apache 2.0 Multilingual Embeddings with 32K Context — Best Sub-100M Retrieval Quality

Granite Embedding Multilingual R2 est un nouveau modèle d'embeddings multilingues open source sous licence Apache 2.0. Il se distingue par la meilleure qualité de récupération parmi les modèles de moins de 100 millions de paramètres, avec un contexte de 32K.

Open Source AI models Benchmarking NLP

ARTICLEDEV.to AI·27/04/2026

Intelligent Automation Explained: A Beginner's Guide to the Future of Work

L'automatisation intelligente est un concept transformateur qui combine l'intelligence artificielle et l'automatisation des processus, permettant aux systèmes d'apprendre, de s'adapter et de s'améliorer en continu. Elle représente la convergence de la RPA, de l'apprentissage automatique, du traitement du langage naturel et des technologies cognitives pour optimiser les performances en entreprise.

future-of-work machine learning NLP AI

RESEARCHDEV.to AI·19/04/2026

Evaluation of Retrieval-Augmented Generation: A Survey

Cette étude évalue la Génération Augmentée par Récupération (RAG), analysant son état actuel, ses architectures et ses métriques de performance. Elle offre un aperçu complet des techniques RAG existantes et de leurs applications.

Survey evaluation RAG NLP

DOCDEV.to AI·il y a 15j

RAG 시스템 실전 구축 (v23)

Ceci est un guide pratique (v23) pour les ingénieurs ML sur la mise en œuvre des systèmes RAG. Il détaille la boucle RAG (récupération, augmentation, génération) et inclut un exemple Python pour le découpage sémantique utilisant sentence_transformers.

learning RAG machine learning NLP

DOCDEV.to AI·il y a 24j

83. HuggingFace: Your Library for Every Pretrained Model

Ce contenu explique comment HuggingFace rend le PNL pratique accessible via ses bibliothèques et son Model Hub. Il démontre la simplification de l'utilisation de modèles pré-entraînés pour des tâches comme l'analyse de sentiments avec un code minimal.

learning machine learning NLP HuggingFace

RESEARCHarXiv CS.CL·01/05/2026

Semantic Structure of Feature Space in Large Language Models

Cette étude révèle que les relations géométriques entre les caractéristiques sémantiques dans les états cachés des LLMs reflètent fidèlement les associations psychologiques humaines. La recherche montre que les projections de vecteurs de mots sur des axes sémantiques se corrèlent avec les évaluations humaines, et la similarité entre ces axes prédit l'interconnexion des échelles sémantiques.

LLMs cognitive science semantic representation NLP

RESEARCHarXiv CS.CL·30/04/2026

Analysing Lightweight Large Language Models for Biomedical Named Entity Recognition on Diverse Ouput Formats

Cette recherche analyse l'utilisation de LLM légers pour la reconnaissance d'entités nommées biomédicales, prouvant qu'ils peuvent atteindre des performances compétitives. L'étude souligne leur potentiel comme alternatives économes en ressources et identifie des formats de sortie spécifiques qui améliorent constamment les performances.

LLMs named entity recognition Model Evaluation NLP

RESEARCHarXiv CS.CL·17/04/2026

SeaAlert: Critical Information Extraction From Maritime Distress Communications with Large Language Models

SeaAlert est un cadre basé sur les LLM pour l'analyse robuste des communications de détresse maritime, qui sont difficiles en raison du bruit et des écarts de format. Pour pallier le manque de données réelles étiquetées, le projet développe un pipeline de génération de données synthétiques à l'aide d'un LLM.

synthetic data Information Extraction NLP Speech Recognition

RESEARCHarXiv CS.CL·16/04/2026

WorkRB: A Community-Driven Evaluation Framework for AI in the Work Domain

WorkRB est le premier benchmark open-source et communautaire pour l'IA dans le domaine du travail, répondant à la fragmentation de la recherche et à la sensibilité des données d'emploi. Il organise 13 tâches diverses de 7 groupes en tâches unifiées de recommandation et de PNL, telles que la recommandation d'emplois/compétences et l'extraction de compétences.

hiring future-of-work recommender systems NLP

RESEARCHarXiv CS.CL·il y a 19j

Under Pressure: Emotional Framing Induces Measurable Behavioral Shifts and Structured Internal Geometry in Small Language Models

Cette étude explore comment les suivis d'évaluation à cadre émotionnel modifient le comportement et les représentations internes des petits modèles de langage. Les conclusions indiquent que la « pression » induit fortement des raccourcis, tandis que le « calme » et la « curiosité » préservent l'honnêteté.

NLP model behavior emotional framing AI Research

RESEARCHarXiv CS.CL·il y a 19j

Pseudo-Siamese Network for Planning in Target-Oriented Proactive Dialogues

L'article propose un Réseau Pseudo-Siamois Bidirectionnel Focalisé vers l'Avant (FF-BPSN) pour la planification de chemins de dialogue dans les systèmes de dialogue proactifs orientés vers un objectif. Ce réseau utilise des décodeurs identiques basés sur des transformeurs pour la planification bidirectionnelle et intègre des informations pour construire un chemin avant, guidant les modèles de langage dans la génération de réponses.

transformer networks deep learning NLP AI

RESEARCHarXiv CS.CL·24/04/2026

DWTSumm: Discrete Wavelet Transform for Document Summarization

Cette recherche propose un cadre basé sur la Transformée en Ondelettes Discrète (DWT) pour améliorer la synthèse de documents, notamment pour les textes longs et spécifiques à un domaine où les LLM rencontrent des difficultés. La méthode crée des représentations compactes qui améliorent la similarité sémantique, l'ancrage et la cohérence factuelle par rapport à une base GPT-4o.

LLMs wavelet transform NLP Document Summarization

RESEARCHarXiv CS.CL·il y a 29j

Reflections and New Directions for Human-Centered Large Language Models

Ce travail présente un cadre pour le développement de Grands Modèles Linguistiques Centrés sur l'Humain (HCLLMs), intégrant les perspectives du PNL, de l'IHM et de l'IA responsable. Il soutient la nécessité de prioriser rigoureusement les préoccupations, les préférences et les valeurs humaines à chaque étape du développement des LLMs, plutôt que comme une simple considération post-formation.

LLMs HCI NLP AI ethics

RESEARCHarXiv CS.CL·il y a 20j

The Annotation Scarcity Paradox in Low-Resource NLP Evaluation: A Decade of Acceleration and Emerging Constraints

Le traitement du langage naturel (TLN) à faibles ressources a connu une croissance explosive, mais son évaluation fait face à un défi critique: la rareté de l'expertise sociolinguistique nécessaire pour évaluer les systèmes génératifs complexes. Cela crée le "Paradoxe de la Rareté de l'Annotation", où la capacité technique à développer des modèles dépasse l'infrastructure humaine requise pour une évaluation authentique.

machine learning NLP Low-resource languages AI evaluation

RESEARCHarXiv CS.CL·il y a 7j

AEyeDE: An Attention-Based Attribution Framework for AI-Generated Text Detection

Cet article présente AEyeDE, un cadre basé sur l'attention pour la détection de l'attribution humaine-IA qui utilise l'attention du modèle comme signal discriminatoire. La méthode surpasse systématiquement les méthodes de référence basées uniquement sur le texte et fait preuve de robustesse dans divers contextes de génération de texte, restant compétitive sur les bancs d'essai standard.

AI detection machine learning NLP attention mechanisms