natural language processing

167 items

ARTICLE↑ trendingHacker News (AI)·il y a 9h

AI takes people at their word

Cet article examine comment l'intelligence artificielle interprète souvent les instructions humaines au pied de la lettre, sans saisir l'intention ou le contexte sous-jacent. Cela peut entraîner des résultats inattendus, voire comiques, en raison du manque de compréhension nuancée de l'IA.

AI limitations AI interpretation natural language processing human-AI interaction

RESEARCHDEV.to AI·il y a 10h

Aligning with Human Judgement: The Role of Pairwise Preference in Large LanguageModel Evaluators

Ce contenu explore le rôle crucial de la préférence par paires dans l'évaluation des Grands Modèles de Langage (LLM). Il discute comment cette méthode peut aider à aligner plus efficacement les performances des LLM avec le jugement humain.

Human Alignment Pairwise Preference natural language processing AI Research

RESEARCHarXiv CS.CL·il y a 1j

Improving Cross-Lingual Factual Recall via Consistency-Driven Reinforcement Learning

Cette recherche introduit PolyFact, un ensemble de données de QA factuel multilingue, pour aborder l'incohérence factuelle interlingue dans les LLMs. Elle constate que l'apprentissage par renforcement via GRPO améliore constamment le rappel factuel interlingue et la généralisation par rapport à l'ajustement fin supervisé.

Multilingual AI LLMs reinforcement learning machine learning

RESEARCHarXiv CS.CL·il y a 1j

CAF-Gen: A Multi-Agent System for Enriching Argumentation Structures

CAF-Gen est un cadre multi-agents conçu pour enrichir les structures d'arguments superficielles en modèles conformes au CAF, palliant les limites des techniques actuelles de fouille d'arguments. Il utilise un pipeline itératif Créateur-Évaluateur pour assurer l'intégrité structurelle et atténuer l'instabilité.

Argumentation Frameworks Argument Mining natural language processing Computational Linguistics

RESEARCHDEV.to AI·24/04/2026

"Go eat a bat, Chang!": On the Emergence of Sinophobic Behavior on WebCommunities in the Face of COVID-19

Cette recherche explore l'émergence de comportements sinophobes au sein des communautés web en ligne pendant la pandémie de COVID-19. Elle met en lumière les sentiments anti-chinois et les discours de haine dans les espaces numériques.

hate-speech social media natural language processing content moderation

RESEARCHarXiv CS.AI·il y a 19h

Automatic Extraction of Structured Information from Brain MRI Reports Using an Open-Weight Large Language Model

Cet article de recherche explore l'extraction automatique de données à partir de rapports d'IRM cérébrale à l'aide du grand modèle linguistique à poids ouvert LLaMA 3.1. Il évalue les performances du LLM dans l'analyse de rapports de neuroradiologie néerlandais, démontrant une performance zero-shot élevée.

Data Extraction natural language processing Neuroradiology Medical Imaging

RESEARCHarXiv CS.CL·il y a 19h

Bidirectional Small-Granularity Search between Code and Text

Cette recherche introduit une nouvelle tâche de recherche bidirectionnelle à petite granularité entre code et texte, visant à lier les publications scientifiques aux segments de code correspondants. Elle propose un grand ensemble de données, partiellement généré par GPT-4, et une approche modulaire qui obtient de bons résultats.

machine learning natural language processing Code Analysis Information Retrieval

RESEARCHarXiv CS.CL·il y a 19h

Community-Specific Slang and Entity Detection via Semantic Shift in Fine-Tuned Language Models

Cette étude propose une méthode non supervisée pour identifier l'argot et les entités uniques des communautés en ligne en analysant l'ampleur du glissement sémantique. Le glissement sémantique est défini comme l'évolution de la représentation codée d'un mot après l'ajustement fin d'un Grand Modèle de Langage (LLM) pré-entraîné sur un corpus de texte spécifique à une communauté.

online-communities semantic-shift natural language processing large language models

RESEARCHarXiv CS.CL·il y a 19h

Retrieval Augmented Generation Framework for the Nepali Legal Domain Question Answering

Cette étude présente la première application d'un modèle de Génération Augmentée par Récupération (RAG) pour la réponse aux questions juridiques en népalais, abordant la rareté des données dans les langues à faibles ressources. En utilisant BM25 sur des documents segmentés, le pipeline RAG a atteint une grande précision et véracité, démontrant son efficacité dans le domaine juridique népalais.

Retrieval Augmented Generation Legal AI Question Answering natural language processing

RESEARCHarXiv CS.CL·il y a 19h

Implicit Causal Graph Construction in Text via Chain Discovery

Cet article étudie la construction de graphes causaux implicites à partir de texte en inférant des événements causaux intermédiaires à l'aide de grands modèles linguistiques (LLM). Il compare la construction de graphes de bout en bout avec les méthodes de découverte de chaînes causales et évalue la validité des relations inférées par rapport à une base de données.

text analysis natural language processing graph theory large language models

ARTICLEDEV.to AI·23/04/2026

How I built an AI RAG system to convert PDF to Q&As

Cet article détaille les cinq étapes d'ingénierie pour construire un système AI RAG nommé LongTermMemory, qui convertit des PDFs en questions-réponses. Il couvre le pipeline complet de traitement de documents, de l'extraction de texte et du découpage sémantique à l'utilisation d'une base de données vectorielle et de la Génération Augmentée par Récupération (RAG), avec un backend Laravel et FastAPI.

Vector Databases RAG natural language processing AI

DOC↑ trendingReddit r/LocalLLaMA·21/04/2026

ibm-granite/granite-4.1-8b · Hugging Face

Granite-4.1-8B est un modèle d'instruction à long contexte de 8 milliards de paramètres d'IBM, amélioré par un réglage fin et un alignement pour des capacités avancées d'appel d'outils, de suivi d'instructions et de chat. Il prend en charge plusieurs langues et a été publié en avril 2026 sous la licence Apache 2.0.

NLP natural language processing AI model Large Language Model

ibm-granite/granite-4.1-8b · Hugging Face

ARTICLE↑ trendingReddit r/MachineLearning·18/04/2026

easyaligner: Forced alignment with GPU acceleration and flexible text normalization (compatible with all w2v2 models on HF Hub) [P]

easyaligner est une nouvelle bibliothèque d'alignement forcé, performante et facile à utiliser, offrant une accélération GPU et une normalisation de texte flexible. Compatible avec tous les modèles w2v2 de Hugging Face Hub, elle résout les défis courants du prétraitement parole-texte, tels que les transcriptions partielles et les longs segments audio.

GPU Acceleration machine learning natural language processing Speech-to-Text

easyaligner: Forced alignment with GPU acceleration and flexible text normalization (compatible with all w2v2 models on HF Hub) [P]

RESEARCH↑ trendingReddit r/MachineLearning·24/04/2026

New project about llm hallucination [P]

Ce contenu présente un nouveau projet annexe et son dépôt GitHub, axé sur l'atténuation des hallucinations des LLM via une méthode innovante d'échantillonnage contrastif et d'entraînement sélectif. L'idée principale considère l'hallucination comme un problème de préférence, utilisant des échantillons négatifs auto-générés et un apprentissage basé sur la divergence et les portes pour promouvoir les bonnes réponses et supprimer les mauvaises.

hallucination model training natural language processing AI safety

ARTICLEDEV.to AI·23/04/2026

Advanced Triage: Using AI to Automate Design Feedback Sorting

Cet article explique comment l'IA peut automatiser le tri et la priorisation des retours de conception des clients. Grâce à l'analyse par couches, l'IA détecte l'urgence et classe les requêtes, transformant le texte vague en données structurées et exploitables pour une efficacité accrue.

design natural language processing feedback management AI

RESEARCH↑ trendingReddit r/LocalLLaMA·10/04/2026

National University of Singapore Presents "DMax": A New Paradigm For Diffusion Language Models (dLLMs) Enabling Aggressive Parallel Decoding.

DMax é um novo paradigma para modelos de linguagem de difusão (dLLMs) eficientes que mitiga o acúmulo de erros na decodificação paralela. Ele permite um paralelismo agressivo ao reformular a decodificação como um processo de auto-refinamento progressivo e introduzir uma estratégia de treinamento unificada.

Diffusion Models Parallel Decoding natural language processing AI

ARTICLE↑ trendingReddit r/MachineLearning·22/04/2026

I can't believe text normalization is so underdiscussed in streaming text-to-speech [D]

L'auteur met en lumière le manque de discussion sur la normalisation de texte dans les modèles de synthèse vocale en streaming, où des erreurs surviennent lors de la prononciation de dates, d'URL et d'autres éléments. Il mentionne un benchmark comparant des modèles TTS commerciaux sur ces défis spécifiques.

AI models natural language processing Benchmarks Text-to-Speech

ARTICLE↑ trendingReddit r/LocalLLaMA·il y a 19j

Qwen3.6 35Ba3 has changed my workflows and even how I use my computer

L'auteur explique comment le modèle d'IA Qwen3.6 35Ba3 a profondément remodelé ses flux de travail de développement et son utilisation de l'ordinateur, lui permettant d'automatiser des tâches complexes et d'interagir avec le système d'exploitation en langage naturel. Cette transformation lui permet de déléguer des tâches comme le devops, la création de contenu et les tests de code à l'IA, soulignant un changement significatif de productivité.

Qwen3.6 natural language processing AI workflow automation

RESEARCHarXiv CS.CL·il y a 1j

HKJudge: A Legal Discourse-Annotated Corpus for Interpreting What Courts Find, How They Reason, and What They Rule

Le projet HKJudge présente le premier corpus de discours juridique annoté par des experts au niveau des phrases, concernant les jugements criminels de Hong Kong, comprenant environ 290 000 phrases. Il utilise un schéma de discours à deux niveaux pour identifier ce que les tribunaux constatent, comment ils raisonnent et ce qu'ils statuent, avec un accord inter-annotateurs élevé.

natural language processing datasets linguistics legal tech

RESEARCHarXiv CS.CL·21/04/2026

Foundational Study on Authorship Attribution of Japanese Web Reviews for Actor Analysis

Cette étude fondamentale explore l'attribution de paternité basée sur des caractéristiques stylistiques pour l'analyse d'acteurs en renseignement sur les menaces, en testant des méthodes sur des revues web japonaises. Alors que le fine-tuning de BERT a obtenu les meilleures performances, TF-IDF avec régression logistique a montré une stabilité et une précision supérieures face à des centaines d'auteurs.

authorship attribution security machine learning natural language processing