natural language processing

167 items

ARTICLE↑ trendingHacker News (AI)·vor 9Std

AI takes people at their word

Dieser Artikel untersucht, wie künstliche Intelligenz menschliche Anweisungen oft wörtlich nimmt, ohne die zugrunde liegende Absicht oder den Kontext zu erfassen. Dies kann aufgrund des mangelnden nuancierten Verständnisses der KI zu unerwarteten oder sogar komischen Ergebnissen führen.

AI limitations AI interpretation natural language processing human-AI interaction

RESEARCHDEV.to AI·vor 10Std

Aligning with Human Judgement: The Role of Pairwise Preference in Large LanguageModel Evaluators

Dieser Inhalt untersucht die entscheidende Rolle der Paarpräferenz bei der Bewertung großer Sprachmodelle (LLMs). Er diskutiert, wie diese Methode dazu beitragen kann, die LLM-Leistung effektiver an menschliche Urteile anzupassen.

Human Alignment Pairwise Preference natural language processing AI Research

RESEARCHarXiv CS.CL·vor 1T

Improving Cross-Lingual Factual Recall via Consistency-Driven Reinforcement Learning

Diese Forschung stellt PolyFact vor, einen mehrsprachigen faktischen QA-Datensatz, um die sprachübergreifende faktische Inkonsistenz in LLMs zu beheben. Es wird festgestellt, dass Reinforcement Learning mittels GRPO die sprachübergreifende faktenbasierte Wiedergabe und Generalisierung im Vergleich zu supervised Fine-Tuning konsistent verbessert.

Multilingual AI LLMs reinforcement learning machine learning

RESEARCHarXiv CS.CL·vor 1T

CAF-Gen: A Multi-Agent System for Enriching Argumentation Structures

CAF-Gen ist ein Multi-Agenten-Framework, das entwickelt wurde, um oberflächliche Argumentstrukturen in CAF-konforme Modelle zu überführen und Einschränkungen aktueller Argument Mining-Techniken zu beheben. Es verwendet eine iterative Creator-Reviewer-Pipeline, um die strukturelle Integrität zu gewährleisten und Instabilität zu mindern.

Argumentation Frameworks Argument Mining natural language processing Computational Linguistics

RESEARCHDEV.to AI·4/24/2026

"Go eat a bat, Chang!": On the Emergence of Sinophobic Behavior on WebCommunities in the Face of COVID-19

Diese Untersuchung erforscht das Auftreten sinophober Verhaltensweisen in Online-Web-Communities während der COVID-19-Pandemie. Sie beleuchtet Fälle von antichinesischen Stimmungen und damit verbundener Hassrede in digitalen Räumen.

hate-speech social media natural language processing content moderation

RESEARCHarXiv CS.AI·vor 19Std

Automatic Extraction of Structured Information from Brain MRI Reports Using an Open-Weight Large Language Model

Diese Forschungsarbeit untersucht die automatische Datenextraktion aus Hirn-MRT-Berichten mithilfe des quelloffenen großen Sprachmodells LLaMA 3.1. Sie bewertet die Leistung des LLM bei der Analyse niederländischer Neuroradiologieberichte und zeigt eine hohe Zero-Shot-Leistung.

Data Extraction natural language processing Neuroradiology Medical Imaging

RESEARCHarXiv CS.CL·vor 19Std

Bidirectional Small-Granularity Search between Code and Text

Diese Forschung stellt eine neue Aufgabe vor: die bidirektionale Suche mit kleiner Granularität zwischen Code und Text, die wissenschaftliche Publikationen mit entsprechenden Codesegmenten verknüpfen soll. Sie schlägt einen großen Datensatz vor, teilweise generiert von GPT-4, und einen modularen Ansatz, der gute Ergebnisse erzielt.

machine learning natural language processing Code Analysis Information Retrieval

RESEARCHarXiv CS.CL·vor 19Std

Community-Specific Slang and Entity Detection via Semantic Shift in Fine-Tuned Language Models

Diese Studie schlägt eine unüberwachte Methode vor, um gemeinschaftsspezifischen Slang und Entitäten durch die Analyse des Ausmaßes der semantischen Verschiebung zu identifizieren. Semantische Verschiebung wird als die Entwicklung der kodierten Repräsentation eines Wortes nach dem Fine-Tuning eines vortrainierten Großen Sprachmodells (LLM) auf einem gemeinschaftsspezifischen Textkorpus definiert.

online-communities semantic-shift natural language processing large language models

RESEARCHarXiv CS.CL·vor 19Std

Retrieval Augmented Generation Framework for the Nepali Legal Domain Question Answering

Diese Studie stellt die erste Anwendung eines Retrieval Augmented Generation (RAG)-Modells für die Beantwortung juristischer Fragen in Nepali vor und adressiert die Datenknappheit in ressourcenarmen Sprachen. Durch die Verwendung von BM25 auf segmentierten Dokumenten erreichte die RAG-Pipeline eine hohe Präzision und Wahrheitsgenauigkeit, was ihre Wirksamkeit im nepalesischen Rechtsbereich demonstriert.

Retrieval Augmented Generation Legal AI Question Answering natural language processing

RESEARCHarXiv CS.CL·vor 19Std

Implicit Causal Graph Construction in Text via Chain Discovery

Diese Arbeit untersucht die Konstruktion impliziter Kausalitätsgraphen aus Text, indem sie Zwischenereignisse mittels großer Sprachmodelle (LLMs) ableitet. Sie vergleicht End-to-End-Graphenkonstruktion mit Kausalkettenentdeckungsverfahren und bewertet die Gültigkeit der abgeleiteten Kausalbeziehungen anhand einer kuratierten Datenbank.

text analysis natural language processing graph theory large language models

ARTICLEDEV.to AI·4/23/2026

How I built an AI RAG system to convert PDF to Q&As

Dieser Artikel beschreibt die fünf technischen Phasen zum Aufbau eines KI-RAG-Systems namens LongTermMemory, das PDFs in Fragen und Antworten umwandelt. Er behandelt die gesamte Dokumentenverarbeitungspipeline, von der Textextraktion und semantischen Segmentierung bis hin zur Nutzung einer Vektordatenbank und Retrieval Augmented Generation (RAG), unterstützt durch Laravel- und FastAPI-Dienste.

Vector Databases RAG natural language processing AI

DOC↑ trendingReddit r/LocalLLaMA·4/21/2026

ibm-granite/granite-4.1-8b · Hugging Face

Granite-4.1-8B ist ein 8 Milliarden Parameter starkes Langkontext-Instruktionsmodell von IBM, das durch Feinabstimmung und Alignment für verbesserte Werkzeugaufruf-, Instruktionsfolge- und Chat-Funktionen optimiert wurde. Es unterstützt mehrere Sprachen und wurde im April 2026 unter der Apache 2.0 Lizenz veröffentlicht.

NLP natural language processing AI model Large Language Model

ibm-granite/granite-4.1-8b · Hugging Face

ARTICLE↑ trendingReddit r/MachineLearning·4/18/2026

easyaligner: Forced alignment with GPU acceleration and flexible text normalization (compatible with all w2v2 models on HF Hub) [P]

easyaligner ist eine neue, performante Forced-Alignment-Bibliothek, die GPU-Beschleunigung und flexible Textnormalisierung bietet und mit allen w2v2-Modellen auf dem Hugging Face Hub kompatibel ist. Sie bewältigt gängige Herausforderungen bei der Speech-to-Text-Vorverarbeitung, wie den Umgang mit teilweisen Transkripten, irrelevantem Audio und langen Segmenten ohne Chunking.

GPU Acceleration machine learning natural language processing Speech-to-Text

easyaligner: Forced alignment with GPU acceleration and flexible text normalization (compatible with all w2v2 models on HF Hub) [P]

RESEARCH↑ trendingReddit r/MachineLearning·4/24/2026

New project about llm hallucination [P]

Dieser Inhalt stellt ein neues Nebenprojekt und dessen GitHub-Repository vor, das sich auf die Minderung von LLM-Halluzinationen mittels einer neuartigen Methode des kontrastiven Samplings und selektiven Trainings konzentriert. Die Kernidee behandelt Halluzination als ein Präferenzproblem, indem sie selbstgenerierte negative Beispiele und divergenzbasiertes, selektives Lernen nutzt, um korrekte Antworten zu fördern und falsche zu unterdrücken.

hallucination model training natural language processing AI safety

ARTICLEDEV.to AI·4/23/2026

Advanced Triage: Using AI to Automate Design Feedback Sorting

Dieser Artikel beschreibt, wie KI die Triage und Priorisierung von Design-Feedback von Kunden automatisieren kann. Durch geschichtetes Parsing erkennt die KI Dringlichkeit und klassifiziert Anfragen, wodurch vager Text in umsetzbare, strukturierte Daten für höhere Effizienz umgewandelt wird.

design natural language processing feedback management AI

RESEARCH↑ trendingReddit r/LocalLLaMA·4/10/2026

National University of Singapore Presents "DMax": A New Paradigm For Diffusion Language Models (dLLMs) Enabling Aggressive Parallel Decoding.

DMax é um novo paradigma para modelos de linguagem de difusão (dLLMs) eficientes que mitiga o acúmulo de erros na decodificação paralela. Ele permite um paralelismo agressivo ao reformular a decodificação como um processo de auto-refinamento progressivo e introduzir uma estratégia de treinamento unificada.

Diffusion Models Parallel Decoding natural language processing AI

ARTICLE↑ trendingReddit r/MachineLearning·4/22/2026

I can't believe text normalization is so underdiscussed in streaming text-to-speech [D]

Der Autor kritisiert die mangelnde Diskussion über Textnormalisierung in Streaming-Text-to-Speech-Modellen, wo Fehler bei der Aussprache von Daten, URLs und anderen grundlegenden Elementen auftreten. Er verweist auf einen Benchmark, der kommerzielle TTS-Modelle hinsichtlich dieser spezifischen Herausforderungen vergleicht.

AI models natural language processing Benchmarks Text-to-Speech

ARTICLE↑ trendingReddit r/LocalLLaMA·vor 19T

Qwen3.6 35Ba3 has changed my workflows and even how I use my computer

Der Autor beschreibt, wie das KI-Modell Qwen3.6 35Ba3 seine Entwicklungsabläufe und die Computernutzung grundlegend verändert hat, indem es ihm ermöglicht, komplexe Aufgaben zu automatisieren und mit dem Betriebssystem mittels natürlicher Sprache zu interagieren. Diese Transformation erlaubt es, Aufgaben wie DevOps, Inhaltserstellung und Codetests an die KI zu delegieren, was eine signifikante Produktivitätssteigerung verdeutlicht.

Qwen3.6 natural language processing AI workflow automation

RESEARCHarXiv CS.CL·vor 1T

HKJudge: A Legal Discourse-Annotated Corpus for Interpreting What Courts Find, How They Reason, and What They Rule

Das HKJudge-Projekt stellt das erste satzweise, von Experten annotierte juristische Diskurskorpus von Hongkonger Strafurteilen vor, das etwa 290.000 Sätze umfasst. Es verwendet ein zweistufiges Diskurschema, um festzuhalten, welche Fakten ein Gericht findet, wie es argumentiert und was es entscheidet, mit hoher Übereinstimmung zwischen den Annotatoren.

natural language processing datasets linguistics legal tech

RESEARCHarXiv CS.CL·4/21/2026

Foundational Study on Authorship Attribution of Japanese Web Reviews for Actor Analysis

Diese Grundlagenstudie untersucht die Urheberschaftsattribuierung mittels stilistischer Merkmale zur Unterstützung der Akteuranalyse in der Bedrohungsintelligenz, getestet mit japanischen Web-Bewertungen. Während BERT Fine-Tuning die beste Leistung erzielte, erwies sich TF-IDF mit logistischer Regression bei Hunderten von Autoren als überlegen in Bezug auf Genauigkeit und Stabilität.

authorship attribution security machine learning natural language processing