NLP

124 items

DOC↑ trendingReddit r/LocalLLaMA·4/21/2026

ibm-granite/granite-4.1-8b · Hugging Face

Granite-4.1-8B ist ein 8 Milliarden Parameter starkes Langkontext-Instruktionsmodell von IBM, das durch Feinabstimmung und Alignment für verbesserte Werkzeugaufruf-, Instruktionsfolge- und Chat-Funktionen optimiert wurde. Es unterstützt mehrere Sprachen und wurde im April 2026 unter der Apache 2.0 Lizenz veröffentlicht.

NLP natural language processing AI model Large Language Model

ibm-granite/granite-4.1-8b · Hugging Face

ARTICLE↑ trendingReddit r/MachineLearning·4/23/2026

Built a normalizer so WER stops penalizing formatting differences in STT evals! [P]

Dieser Inhalt befasst sich mit dem Problem, dass die Wortfehlerrate (WER) Formatierungsunterschiede bei STT-Bewertungen bestraft, was zu ungenauen Ergebnissen führt. Um dies zu beheben, wurde die Open-Source-Bibliothek `gladia-normalization` veröffentlicht, die Transkripte vor der WER-Berechnung normalisiert und so eine fairere Bewertung der Erkennungsqualität gewährleistet.

Open Source evaluation NLP Speech-to-Text

ARTICLE↑ trendingReddit r/MachineLearning·4/23/2026

First time fine-tuning, need a sanity check — 3B or 7B for multi-task reasoning? [D]

Ein autodidaktischer Nutzer, der neu im Bereich Fine-Tuning ist, sucht Rat bei der Wahl zwischen 3B- und 7B-LLM-Modellen für ein Multi-Task-Reasoning-Projekt. Das Projekt umfasst das Verständnis der zugrunde liegenden Fragen, die Beibehaltung mehrerer Perspektiven und den Umgang mit unübersichtlichen Eingaben.

LLMs model selection multi-task reasoning NLP

RESEARCH↑ trendingReddit r/MachineLearning·4/22/2026

EMNLP workshop any good? Or any other NLP venue good for VLM eval work? [D]

Der Inhalt fragt nach der Eignung von EMNLP-Workshops für die Evaluationsarbeit von Vision-Language Models (VLM). Es werden auch Empfehlungen für andere gute NLP-Veranstaltungsorte für diese Art von Forschung gesucht.

evaluation VLM NLP research venues

RESEARCHarXiv CS.CL·vor 18T

PromptNCE: Pointwise Mutual Information Predictions Using Only LLMs and Contrastive Estimation Prompts

Diese Arbeit stellt PromptNCE vor, eine Methode zur Schätzung der punktweisen gegenseitigen Information (PMI) unter Verwendung von nur LLMs und kontrastiven Schätzungsprompts, wodurch die Notwendigkeit aufgabenspezifischer Kritiker entfällt. Sie präsentiert einen Benchmark mit von Menschen abgeleiteter PMI und zeigt, dass PromptNCE eine Spearman-Korrelation von bis zu 0,82 erreicht.

information theory LLMs prompt engineering machine learning

DOCDEV.to AI·4/16/2026

Automating Your Literature Review: From PDFs to Data with AI

Dieser Inhalt beschreibt, wie KI-Automatisierung Literaturrecherchen transformieren kann, indem sie PDF-Screening und Datenextraktion effizienter und reproduzierbarer macht. Er schlägt einen iterativen Ansatz und die Kombination von Tools wie GROBID und spaCy für einen praktischen Workflow vor.

AI automation Data Extraction literature review NLP

ARTICLEDEV.to AI·4/19/2026

Building Conversational AI in Amharic: Lessons from Creating Ethiopia's First Voice AI Tutor

Ein Startup entwickelte Äthiopiens ersten Sprach-KI-Tutor für Amharisch und stellte fest, dass einfache Übersetzungen aufgrund der einzigartigen grammatikalischen Strukturen und kulturellen Kontexte der Sprache versagen. Das Projekt stieß dabei auf Komplexitäten mit der Ge'ez-Schrift und begrenzten Trainingsdaten.

NLP amharic less-resourced-languages Conversational AI

DOCML Mastery·vor 4T

Building Semantic Search with Transformers.js and Sentence Embeddings

Dieser Inhalt behandelt das häufige Problem, dass Benutzersuchen aufgrund mangelnden semantischen Verständnisses keine Ergebnisse liefern. Er schlägt vor, eine semantische Suchfunktion mit Transformers.js und Satz-Embeddings zu entwickeln, um die Relevanz der Ergebnisse zu verbessern.

sentence embeddings search NLP Transformers.js

Building Semantic Search with Transformers.js and Sentence Embeddings

RESEARCHarXiv CS.CL·4/16/2026

Text-as-Signal: Quantitative Semantic Scoring with Embeddings, Logprobs, and Noise Reduction

Dieses Papier stellt eine praktische Pipeline vor, um Textkorpora mithilfe von Embeddings, Logprob-basierter Evaluation und Rauschunterdrückung in quantitative semantische Signale umzuwandeln. Die Fallstudie wendet sechs semantische Dimensionen auf portugiesische Nachrichtenartikel über KI an, um Aufgaben des KI-Engineerings wie Korpusinspektion und -überwachung zu unterstützen.

machine learning NLP embeddings semantic analysis

RESEARCHDEV.to AI·4/13/2026

TALM: Tool Augmented Language Models

TALM (Tool Augmented Language Models) konzentriert sich auf die Integration externer Werkzeuge mit großen Sprachmodellen, um deren Fähigkeiten zu erweitern. Dieser Ansatz ermöglicht es LLMs, komplexe Aufgaben effektiver zu bewältigen, indem sie spezialisierte Funktionen und reale Interaktionen nutzen.

language models LLMs NLP Tool Augmentation

ARTICLEDEV.to AI·4/15/2026

How We Built 1,000+ AI Personas for Telegram Comments

Dieser Artikel beschreibt den Bau eines KI-Systems, das über 1.000 einzigartige Personas für Telegram-Kommentare generiert, nachdem menschliche Teams gescheitert waren. Er detailliert die Schaffung persistenter Persönlichkeiten mit natürlichem Verhalten und die Überwindung technischer Herausforderungen wie Anti-Bot-Systeme und KI-gestützte Spam-Moderation.

Telegram Personas NLP AI

RESEARCHarXiv CS.AI·4/7/2026

Beyond Predefined Schemas: TRACE-KG for Context-Enriched Knowledge Graphs from Complex Documents

TRACE-KG é um framework multimodal que constrói grafos de conhecimento enriquecidos por contexto e um esquema induzido, superando limitações de métodos baseados em ontologias ou esquemas livres. Ele organiza entidades e relações usando um esquema guiado por dados, mantendo a rastreabilidade e capturando relações condicionais.

multimodal AI schema induction Knowledge Graphs document understanding

ARTICLEDEV.to AI·4/18/2026

India's Homegrown AI Ecosystem: 110+ Apps Across 22 Languages and 28 Sectors

Indien entwickelt sich zu einer bedeutenden KI-Marktchance mit über 110 Apps in 22 Sprachen und 28 Sektoren, angetrieben durch 3,8 Mrd. USD an Investitionen und eine große Internetnutzerbasis. Das Land schließt aktiv die Sprachzugangslücke mit selbst entwickelten Basismodellen und weist eine hohe Konzentration an Top-KI-Talenten auf.

market opportunity AI ecosystem India NLP

RESEARCHDEV.to AI·4/18/2026

Braille-D-FUMT8 vs CLIP / BERT / ImageBind: a Rigorous Information-Theoretic Comparison

Dieser Artikel, eine Neuveröffentlichung des Rei-AIOS Papiers 110, präsentiert einen rigorosen informationstheoretischen Vergleich zwischen der Braille-Unicode × D-FUMT8 Kodierung und multimodalen Embedding-Schemata wie CLIP, BERT und ImageBind. Die Forschung untersucht die Darstellung von 256 philosophischen Zuständen innerhalb eines einzelnen 3-Byte UTF-8 Zeichens.

information theory AI models multimodal AI NLP

ARTICLEKDNuggets·vor 4T

3 SpaCy Tricks for Efficient Text Processing & Entity Recognition

Dieser Artikel beleuchtet drei wesentliche spaCy-Tricks für Entwickler, um die Verarbeitungsgeschwindigkeit zu maximieren. Er konzentriert sich auf die Anpassung der Entitätserkennung für effiziente Workflows.

text processing entity recognition NLP Python

3 SpaCy Tricks for Efficient Text Processing & Entity Recognition

RESEARCHarXiv CS.CL·4/9/2026

Consistency-Guided Decoding with Proof-Driven Disambiguation for Three-Way Logical Question Answering

Este conteúdo apresenta CGD-PD, uma camada leve para modelos de linguagem grandes (LLMs) que melhora a resposta a perguntas lógicas de três vias (Verdadeiro/Falso/Desconhecido). Ele aborda falhas recorrentes como inconsistência de negação e previsões 'Desconhecido' epistêmicas, utilizando decisões consistentes e desambiguação baseada em prova para maior precisão.

LLMs Question Answering consistency NLP

RESEARCHarXiv CS.AI·vor 29T

When Does a Language Model Commit? A Finite-Answer Theory of Pre-Verbalization Commitment

Diese Forschung führt eine Theorie der "Stabilisierung der endlichen Antwortpräferenz" ein, um zu bestimmen, wann die Antwortpräferenz eines Sprachmodells stabil wird. Es zeigt sich, dass diese Stabilisierung oft vor der verbalisierbaren Antwort erfolgt, mit einem deutlichen Vorlauf.

language models cognitive science machine learning NLP

RESEARCHarXiv CS.CL·vor 7T

SENSE: Semantic Embedding Navigation with Soft-gated Evaluation for Retrieval-based Speculative Decoding

Dieses Papier schlägt SENSE (Semantic Embedding Navigation with Soft-gated Evaluation) vor, um Retrieval-basierte Spekulative Dekodierung (RSD) für LLMs zu verbessern. SENSE adressiert die starren lexikalischen Abhängigkeiten von RSD, indem es robuste semantische Ausrichtung und ein Soft-gated Evaluationsmodul verwendet, um semantische Äquivalenz zu validieren.

LLMs NLP Inference Optimization Speculative Decoding

RESEARCHarXiv CS.CL·4/7/2026

Are Arabic Benchmarks Reliable? QIMMA's Quality-First Approach to LLM Evaluation

QIMMA é uma nova plataforma de avaliação de LLMs em árabe que prioriza a qualidade, realizando validação sistemática de benchmarks. Ela resolve problemas de qualidade em benchmarks existentes através de revisão automatizada e humana, resultando em um conjunto de avaliação reprodutível e multi-tarefa com mais de 52 mil amostras.

Arabic LLM NLP Benchmarks Quality Assurance

RESEARCHarXiv CS.AI·vor 4T

Synthetic Contrastive Reasoning for Multi-Table Q&A

Die Studie stellt einen synthetischen Kontrastiv-Reasoning-Trace-Datensatz für Multi-Tabellen-Frage-Antwort-Systeme (MMQA) vor, um die in bestehenden Ressourcen fehlende Reasoning-Supervision zu adressieren. Offene LLMs, die mit Contrastive Preference Optimization (CPO) unter Verwendung dieses Datensatzes feinabgestimmt wurden, zeigten signifikante Leistungsverbesserungen.

Question Answering machine learning NLP datasets