← heapsort-ai

NLP

124 items

ARTICLEDEV.to AI·09/05/2026

Your RAG can't answer 'why' -- GraphRAG finds what vector search misses

Cet article explore les limites des systèmes RAG (Retrieval-Augmented Generation) conventionnels, qui échouent à répondre aux questions du type « pourquoi » car la recherche vectorielle ne trouve que des documents similaires, et non des documents liés. Il introduit GraphRAG comme une solution pour dépasser ce « plafond structurel » en permettant au système de relier les informations. L'auteur partage une anecdote personnelle sur la frustration de découvrir ce goulot d'étranglement architectural après des tentatives infructueuses de réécrire des prompts.

27
ARTICLEDEV.to AI·27/04/2026

Intelligent Automation Explained: A Beginner's Guide to the Future of Work

L'automatisation intelligente est un concept transformateur qui combine l'intelligence artificielle et l'automatisation des processus, permettant aux systèmes d'apprendre, de s'adapter et de s'améliorer en continu. Elle représente la convergence de la RPA, de l'apprentissage automatique, du traitement du langage naturel et des technologies cognitives pour optimiser les performances en entreprise.

27
DOCDEV.to AI·il y a 15j

RAG 시스템 실전 구축 (v23)

Ceci est un guide pratique (v23) pour les ingénieurs ML sur la mise en œuvre des systèmes RAG. Il détaille la boucle RAG (récupération, augmentation, génération) et inclut un exemple Python pour le découpage sémantique utilisant sentence_transformers.

27
RESEARCHarXiv CS.CL·01/05/2026

Semantic Structure of Feature Space in Large Language Models

Cette étude révèle que les relations géométriques entre les caractéristiques sémantiques dans les états cachés des LLMs reflètent fidèlement les associations psychologiques humaines. La recherche montre que les projections de vecteurs de mots sur des axes sémantiques se corrèlent avec les évaluations humaines, et la similarité entre ces axes prédit l'interconnexion des échelles sémantiques.

27
RESEARCHarXiv CS.CL·30/04/2026

Analysing Lightweight Large Language Models for Biomedical Named Entity Recognition on Diverse Ouput Formats

Cette recherche analyse l'utilisation de LLM légers pour la reconnaissance d'entités nommées biomédicales, prouvant qu'ils peuvent atteindre des performances compétitives. L'étude souligne leur potentiel comme alternatives économes en ressources et identifie des formats de sortie spécifiques qui améliorent constamment les performances.

27
RESEARCHarXiv CS.CL·17/04/2026

SeaAlert: Critical Information Extraction From Maritime Distress Communications with Large Language Models

SeaAlert est un cadre basé sur les LLM pour l'analyse robuste des communications de détresse maritime, qui sont difficiles en raison du bruit et des écarts de format. Pour pallier le manque de données réelles étiquetées, le projet développe un pipeline de génération de données synthétiques à l'aide d'un LLM.

27
RESEARCHarXiv CS.CL·16/04/2026

WorkRB: A Community-Driven Evaluation Framework for AI in the Work Domain

WorkRB est le premier benchmark open-source et communautaire pour l'IA dans le domaine du travail, répondant à la fragmentation de la recherche et à la sensibilité des données d'emploi. Il organise 13 tâches diverses de 7 groupes en tâches unifiées de recommandation et de PNL, telles que la recommandation d'emplois/compétences et l'extraction de compétences.

27
RESEARCHarXiv CS.CL·il y a 19j

Under Pressure: Emotional Framing Induces Measurable Behavioral Shifts and Structured Internal Geometry in Small Language Models

Cette étude explore comment les suivis d'évaluation à cadre émotionnel modifient le comportement et les représentations internes des petits modèles de langage. Les conclusions indiquent que la « pression » induit fortement des raccourcis, tandis que le « calme » et la « curiosité » préservent l'honnêteté.

27
RESEARCHarXiv CS.CL·il y a 19j

Pseudo-Siamese Network for Planning in Target-Oriented Proactive Dialogues

L'article propose un Réseau Pseudo-Siamois Bidirectionnel Focalisé vers l'Avant (FF-BPSN) pour la planification de chemins de dialogue dans les systèmes de dialogue proactifs orientés vers un objectif. Ce réseau utilise des décodeurs identiques basés sur des transformeurs pour la planification bidirectionnelle et intègre des informations pour construire un chemin avant, guidant les modèles de langage dans la génération de réponses.

27
RESEARCHarXiv CS.CL·24/04/2026

DWTSumm: Discrete Wavelet Transform for Document Summarization

Cette recherche propose un cadre basé sur la Transformée en Ondelettes Discrète (DWT) pour améliorer la synthèse de documents, notamment pour les textes longs et spécifiques à un domaine où les LLM rencontrent des difficultés. La méthode crée des représentations compactes qui améliorent la similarité sémantique, l'ancrage et la cohérence factuelle par rapport à une base GPT-4o.

27
RESEARCHarXiv CS.CL·il y a 29j

Reflections and New Directions for Human-Centered Large Language Models

Ce travail présente un cadre pour le développement de Grands Modèles Linguistiques Centrés sur l'Humain (HCLLMs), intégrant les perspectives du PNL, de l'IHM et de l'IA responsable. Il soutient la nécessité de prioriser rigoureusement les préoccupations, les préférences et les valeurs humaines à chaque étape du développement des LLMs, plutôt que comme une simple considération post-formation.

27
RESEARCHarXiv CS.CL·il y a 20j

The Annotation Scarcity Paradox in Low-Resource NLP Evaluation: A Decade of Acceleration and Emerging Constraints

Le traitement du langage naturel (TLN) à faibles ressources a connu une croissance explosive, mais son évaluation fait face à un défi critique: la rareté de l'expertise sociolinguistique nécessaire pour évaluer les systèmes génératifs complexes. Cela crée le "Paradoxe de la Rareté de l'Annotation", où la capacité technique à développer des modèles dépasse l'infrastructure humaine requise pour une évaluation authentique.

27
RESEARCHarXiv CS.CL·il y a 7j

AEyeDE: An Attention-Based Attribution Framework for AI-Generated Text Detection

Cet article présente AEyeDE, un cadre basé sur l'attention pour la détection de l'attribution humaine-IA qui utilise l'attention du modèle comme signal discriminatoire. La méthode surpasse systématiquement les méthodes de référence basées uniquement sur le texte et fait preuve de robustesse dans divers contextes de génération de texte, restant compétitive sur les bancs d'essai standard.

27