NLP

124 items

DOC↑ trendingReddit r/LocalLLaMA·21/04/2026

ibm-granite/granite-4.1-8b · Hugging Face

Granite-4.1-8B est un modèle d'instruction à long contexte de 8 milliards de paramètres d'IBM, amélioré par un réglage fin et un alignement pour des capacités avancées d'appel d'outils, de suivi d'instructions et de chat. Il prend en charge plusieurs langues et a été publié en avril 2026 sous la licence Apache 2.0.

NLP natural language processing AI model Large Language Model

ibm-granite/granite-4.1-8b · Hugging Face

ARTICLE↑ trendingReddit r/MachineLearning·23/04/2026

Built a normalizer so WER stops penalizing formatting differences in STT evals! [P]

Ce contenu traite du problème de la pénalisation des différences de formatage par le Taux d'Erreur de Mots (WER) dans les évaluations STT, entraînant des scores imprécis. Pour résoudre ce problème, la bibliothèque open-source `gladia-normalization` a été lancée, qui normalise les transcriptions avant le calcul du WER, garantissant une évaluation plus juste de la qualité de la reconnaissance.

Open Source evaluation NLP Speech-to-Text

ARTICLE↑ trendingReddit r/MachineLearning·23/04/2026

First time fine-tuning, need a sanity check — 3B or 7B for multi-task reasoning? [D]

Un utilisateur autodidacte, débutant en fine-tuning, demande conseil pour choisir entre des modèles LLM 3B et 7B pour un projet de raisonnement multi-tâches. Le projet vise à comprendre l'intention sous-jacente des questions, à maintenir plusieurs perspectives et à gérer des entrées complexes.

LLMs model selection multi-task reasoning NLP

RESEARCH↑ trendingReddit r/MachineLearning·22/04/2026

EMNLP workshop any good? Or any other NLP venue good for VLM eval work? [D]

Le contenu interroge sur la pertinence des ateliers EMNLP pour les travaux d'évaluation des modèles de vision-langage (VLM). Il demande également des recommandations pour d'autres bonnes conférences PNL pour ce type de recherche.

evaluation VLM NLP research venues

RESEARCHarXiv CS.CL·il y a 18j

PromptNCE: Pointwise Mutual Information Predictions Using Only LLMs and Contrastive Estimation Prompts

Cet article introduit PromptNCE, une méthode pour estimer l'information mutuelle ponctuelle (PMI) en utilisant uniquement des LLM et des invites d'estimation contrastive, contournant le besoin de critiques spécifiques à la tâche. Il présente un benchmark avec des PMI dérivés de l'humain et montre que PromptNCE atteint une corrélation de Spearman allant jusqu'à 0,82.

information theory LLMs prompt engineering machine learning

DOCDEV.to AI·16/04/2026

Automating Your Literature Review: From PDFs to Data with AI

Ce contenu explique comment l'automatisation par l'IA peut transformer les revues de littérature, rendant le criblage et l'extraction de données de PDF plus efficaces et reproductibles. Il suggère une approche itérative et la combinaison d'outils comme GROBID et spaCy pour un flux de travail pratique.

AI automation Data Extraction literature review NLP

ARTICLEDEV.to AI·19/04/2026

Building Conversational AI in Amharic: Lessons from Creating Ethiopia's First Voice AI Tutor

Une startup a développé le premier tuteur d'IA vocale pour l'amharique, constatant qu'une simple traduction est inefficace en raison des structures grammaticales et contextes culturels uniques de la langue. Le projet a rencontré des difficultés avec le script Ge'ez et le manque de données d'entraînement.

NLP amharic less-resourced-languages Conversational AI

DOCML Mastery·il y a 4j

Building Semantic Search with Transformers.js and Sentence Embeddings

Ce contenu traite du problème courant des recherches d'utilisateurs qui ne donnent aucun résultat en raison d'un manque de compréhension sémantique. Il propose de construire une fonctionnalité de recherche sémantique à l'aide de Transformers.js et d'embeddings de phrases pour améliorer la pertinence des résultats.

sentence embeddings search NLP Transformers.js

Building Semantic Search with Transformers.js and Sentence Embeddings

RESEARCHarXiv CS.CL·16/04/2026

Text-as-Signal: Quantitative Semantic Scoring with Embeddings, Logprobs, and Noise Reduction

Cet article présente un pipeline pratique pour transformer des corpus de texte en signaux sémantiques quantitatifs, en utilisant des embeddings, une évaluation basée sur les logprobs et la réduction du bruit. L'étude de cas applique six dimensions sémantiques à des articles de presse portugais sur l'IA, soutenant des tâches d'ingénierie de l'IA telles que l'inspection et le suivi de corpus.

machine learning NLP embeddings semantic analysis

RESEARCHDEV.to AI·13/04/2026

TALM: Tool Augmented Language Models

TALM (Tool Augmented Language Models) se concentre sur l'intégration d'outils externes avec des modèles de langage volumineux pour augmenter leurs capacités. Cette approche permet aux LLM d'effectuer des tâches complexes plus efficacement en tirant parti de fonctions spécialisées et d'interactions réelles.

language models LLMs NLP Tool Augmentation

ARTICLEDEV.to AI·15/04/2026

How We Built 1,000+ AI Personas for Telegram Comments

Cet article décrit la construction d'un système d'IA générant plus de 1 000 personas uniques pour les commentaires Telegram, après l'échec d'équipes humaines. Il détaille la création de personnalités persistantes au comportement naturel et la surmontée des défis techniques tels que les systèmes anti-bot et la modération du spam par IA.

Telegram Personas NLP AI

RESEARCHarXiv CS.AI·07/04/2026

Beyond Predefined Schemas: TRACE-KG for Context-Enriched Knowledge Graphs from Complex Documents

TRACE-KG é um framework multimodal que constrói grafos de conhecimento enriquecidos por contexto e um esquema induzido, superando limitações de métodos baseados em ontologias ou esquemas livres. Ele organiza entidades e relações usando um esquema guiado por dados, mantendo a rastreabilidade e capturando relações condicionais.

multimodal AI schema induction Knowledge Graphs document understanding

ARTICLEDEV.to AI·18/04/2026

India's Homegrown AI Ecosystem: 110+ Apps Across 22 Languages and 28 Sectors

L'Inde représente une opportunité majeure pour l'IA, avec plus de 110 applications couvrant 22 langues et 28 secteurs, soutenue par 3,8 milliards de dollars d'investissement. Le pays comble activement le fossé linguistique grâce à des modèles d'IA locaux et se positionne comme un pôle de talents en IA.

market opportunity AI ecosystem India NLP

RESEARCHDEV.to AI·18/04/2026

Braille-D-FUMT8 vs CLIP / BERT / ImageBind: a Rigorous Information-Theoretic Comparison

Cet article, une republication du Rei-AIOS Paper 110, présente une comparaison informationnelle rigoureuse entre l'encodage Braille-Unicode × D-FUMT8 et des schémas d'embedding multimodaux tels que CLIP, BERT et ImageBind. La recherche explore la représentation de 256 états philosophiques dans un unique caractère UTF-8 de 3 octets.

information theory AI models multimodal AI NLP

ARTICLEKDNuggets·il y a 4j

3 SpaCy Tricks for Efficient Text Processing & Entity Recognition

Cet article explore trois astuces essentielles de spaCy pour les développeurs, visant à maximiser la vitesse de traitement. Il se concentre sur la personnalisation de la reconnaissance d'entités pour des flux de travail efficaces.

text processing entity recognition NLP Python

3 SpaCy Tricks for Efficient Text Processing & Entity Recognition

RESEARCHarXiv CS.CL·09/04/2026

Consistency-Guided Decoding with Proof-Driven Disambiguation for Three-Way Logical Question Answering

Este conteúdo apresenta CGD-PD, uma camada leve para modelos de linguagem grandes (LLMs) que melhora a resposta a perguntas lógicas de três vias (Verdadeiro/Falso/Desconhecido). Ele aborda falhas recorrentes como inconsistência de negação e previsões 'Desconhecido' epistêmicas, utilizando decisões consistentes e desambiguação baseada em prova para maior precisão.

LLMs Question Answering consistency NLP

RESEARCHarXiv CS.AI·il y a 29j

When Does a Language Model Commit? A Finite-Answer Theory of Pre-Verbalization Commitment

Cette recherche introduit une théorie de la "stabilisation de la préférence de réponse finie" pour déterminer quand la préférence de réponse d'un modèle linguistique devient stable. Elle démontre que cette stabilisation se produit souvent avant que la réponse ne soit verbalisable, avec une avance significative.

language models cognitive science machine learning NLP

RESEARCHarXiv CS.CL·il y a 7j

SENSE: Semantic Embedding Navigation with Soft-gated Evaluation for Retrieval-based Speculative Decoding

Cet article propose SENSE (Semantic Embedding Navigation with Soft-gated Evaluation) pour améliorer le Décodage Spéculatif Basé sur la Récupération (RSD) pour les LLM. SENSE s'attaque aux dépendances lexicales rigides du RSD en utilisant un alignement sémantique robuste et un module d'évaluation à porte souple pour valider l'équivalence sémantique.

LLMs NLP Inference Optimization Speculative Decoding

RESEARCHarXiv CS.CL·07/04/2026

Are Arabic Benchmarks Reliable? QIMMA's Quality-First Approach to LLM Evaluation

QIMMA é uma nova plataforma de avaliação de LLMs em árabe que prioriza a qualidade, realizando validação sistemática de benchmarks. Ela resolve problemas de qualidade em benchmarks existentes através de revisão automatizada e humana, resultando em um conjunto de avaliação reprodutível e multi-tarefa com mais de 52 mil amostras.

Arabic LLM NLP Benchmarks Quality Assurance

RESEARCHarXiv CS.AI·il y a 4j

Synthetic Contrastive Reasoning for Multi-Table Q&A

Cet article présente un ensemble de données synthétique de traces de raisonnement contrastif pour la question-réponse multi-tables (MMQA), visant à fournir une supervision de raisonnement absente des ressources existantes. Des LLM open-source, affinés avec l'Optimisation de Préférence Contrastive (CPO) à l'aide de cet ensemble de données, ont montré des améliorations significatives de performance.

Question Answering machine learning NLP datasets