← heapsort-ai

natural language processing

167 items

RESEARCHarXiv CS.CL·vor 1T

Improving Cross-Lingual Factual Recall via Consistency-Driven Reinforcement Learning

Diese Forschung stellt PolyFact vor, einen mehrsprachigen faktischen QA-Datensatz, um die sprachübergreifende faktische Inkonsistenz in LLMs zu beheben. Es wird festgestellt, dass Reinforcement Learning mittels GRPO die sprachübergreifende faktenbasierte Wiedergabe und Generalisierung im Vergleich zu supervised Fine-Tuning konsistent verbessert.

60
RESEARCHarXiv CS.CL·vor 1T

CAF-Gen: A Multi-Agent System for Enriching Argumentation Structures

CAF-Gen ist ein Multi-Agenten-Framework, das entwickelt wurde, um oberflächliche Argumentstrukturen in CAF-konforme Modelle zu überführen und Einschränkungen aktueller Argument Mining-Techniken zu beheben. Es verwendet eine iterative Creator-Reviewer-Pipeline, um die strukturelle Integrität zu gewährleisten und Instabilität zu mindern.

60
RESEARCHarXiv CS.CL·vor 19Std

Bidirectional Small-Granularity Search between Code and Text

Diese Forschung stellt eine neue Aufgabe vor: die bidirektionale Suche mit kleiner Granularität zwischen Code und Text, die wissenschaftliche Publikationen mit entsprechenden Codesegmenten verknüpfen soll. Sie schlägt einen großen Datensatz vor, teilweise generiert von GPT-4, und einen modularen Ansatz, der gute Ergebnisse erzielt.

54
RESEARCHarXiv CS.CL·vor 19Std

Community-Specific Slang and Entity Detection via Semantic Shift in Fine-Tuned Language Models

Diese Studie schlägt eine unüberwachte Methode vor, um gemeinschaftsspezifischen Slang und Entitäten durch die Analyse des Ausmaßes der semantischen Verschiebung zu identifizieren. Semantische Verschiebung wird als die Entwicklung der kodierten Repräsentation eines Wortes nach dem Fine-Tuning eines vortrainierten Großen Sprachmodells (LLM) auf einem gemeinschaftsspezifischen Textkorpus definiert.

54
RESEARCHarXiv CS.CL·vor 19Std

Retrieval Augmented Generation Framework for the Nepali Legal Domain Question Answering

Diese Studie stellt die erste Anwendung eines Retrieval Augmented Generation (RAG)-Modells für die Beantwortung juristischer Fragen in Nepali vor und adressiert die Datenknappheit in ressourcenarmen Sprachen. Durch die Verwendung von BM25 auf segmentierten Dokumenten erreichte die RAG-Pipeline eine hohe Präzision und Wahrheitsgenauigkeit, was ihre Wirksamkeit im nepalesischen Rechtsbereich demonstriert.

54
RESEARCHarXiv CS.CL·vor 19Std

Implicit Causal Graph Construction in Text via Chain Discovery

Diese Arbeit untersucht die Konstruktion impliziter Kausalitätsgraphen aus Text, indem sie Zwischenereignisse mittels großer Sprachmodelle (LLMs) ableitet. Sie vergleicht End-to-End-Graphenkonstruktion mit Kausalkettenentdeckungsverfahren und bewertet die Gültigkeit der abgeleiteten Kausalbeziehungen anhand einer kuratierten Datenbank.

54
ARTICLEDEV.to AI·4/23/2026

How I built an AI RAG system to convert PDF to Q&As

Dieser Artikel beschreibt die fünf technischen Phasen zum Aufbau eines KI-RAG-Systems namens LongTermMemory, das PDFs in Fragen und Antworten umwandelt. Er behandelt die gesamte Dokumentenverarbeitungspipeline, von der Textextraktion und semantischen Segmentierung bis hin zur Nutzung einer Vektordatenbank und Retrieval Augmented Generation (RAG), unterstützt durch Laravel- und FastAPI-Dienste.

49
ARTICLE↑ trendingReddit r/MachineLearning·4/18/2026

easyaligner: Forced alignment with GPU acceleration and flexible text normalization (compatible with all w2v2 models on HF Hub) [P]

easyaligner ist eine neue, performante Forced-Alignment-Bibliothek, die GPU-Beschleunigung und flexible Textnormalisierung bietet und mit allen w2v2-Modellen auf dem Hugging Face Hub kompatibel ist. Sie bewältigt gängige Herausforderungen bei der Speech-to-Text-Vorverarbeitung, wie den Umgang mit teilweisen Transkripten, irrelevantem Audio und langen Segmenten ohne Chunking.

easyaligner: Forced alignment with GPU acceleration and flexible text normalization (compatible with all w2v2 models on HF Hub) [P]
46
RESEARCH↑ trendingReddit r/MachineLearning·4/24/2026

New project about llm hallucination [P]

Dieser Inhalt stellt ein neues Nebenprojekt und dessen GitHub-Repository vor, das sich auf die Minderung von LLM-Halluzinationen mittels einer neuartigen Methode des kontrastiven Samplings und selektiven Trainings konzentriert. Die Kernidee behandelt Halluzination als ein Präferenzproblem, indem sie selbstgenerierte negative Beispiele und divergenzbasiertes, selektives Lernen nutzt, um korrekte Antworten zu fördern und falsche zu unterdrücken.

New project about llm hallucination [P]
45
RESEARCH↑ trendingReddit r/LocalLLaMA·4/10/2026

National University of Singapore Presents "DMax": A New Paradigm For Diffusion Language Models (dLLMs) Enabling Aggressive Parallel Decoding.

DMax é um novo paradigma para modelos de linguagem de difusão (dLLMs) eficientes que mitiga o acúmulo de erros na decodificação paralela. Ele permite um paralelismo agressivo ao reformular a decodificação como um processo de auto-refinamento progressivo e introduzir uma estratégia de treinamento unificada.

44
ARTICLE↑ trendingReddit r/MachineLearning·4/22/2026

I can't believe text normalization is so underdiscussed in streaming text-to-speech [D]

Der Autor kritisiert die mangelnde Diskussion über Textnormalisierung in Streaming-Text-to-Speech-Modellen, wo Fehler bei der Aussprache von Daten, URLs und anderen grundlegenden Elementen auftreten. Er verweist auf einen Benchmark, der kommerzielle TTS-Modelle hinsichtlich dieser spezifischen Herausforderungen vergleicht.

42
ARTICLE↑ trendingReddit r/LocalLLaMA·vor 19T

Qwen3.6 35Ba3 has changed my workflows and even how I use my computer

Der Autor beschreibt, wie das KI-Modell Qwen3.6 35Ba3 seine Entwicklungsabläufe und die Computernutzung grundlegend verändert hat, indem es ihm ermöglicht, komplexe Aufgaben zu automatisieren und mit dem Betriebssystem mittels natürlicher Sprache zu interagieren. Diese Transformation erlaubt es, Aufgaben wie DevOps, Inhaltserstellung und Codetests an die KI zu delegieren, was eine signifikante Produktivitätssteigerung verdeutlicht.

42
RESEARCHarXiv CS.CL·vor 1T

HKJudge: A Legal Discourse-Annotated Corpus for Interpreting What Courts Find, How They Reason, and What They Rule

Das HKJudge-Projekt stellt das erste satzweise, von Experten annotierte juristische Diskurskorpus von Hongkonger Strafurteilen vor, das etwa 290.000 Sätze umfasst. Es verwendet ein zweistufiges Diskurschema, um festzuhalten, welche Fakten ein Gericht findet, wie es argumentiert und was es entscheidet, mit hoher Übereinstimmung zwischen den Annotatoren.

40
RESEARCHarXiv CS.CL·4/21/2026

Foundational Study on Authorship Attribution of Japanese Web Reviews for Actor Analysis

Diese Grundlagenstudie untersucht die Urheberschaftsattribuierung mittels stilistischer Merkmale zur Unterstützung der Akteuranalyse in der Bedrohungsintelligenz, getestet mit japanischen Web-Bewertungen. Während BERT Fine-Tuning die beste Leistung erzielte, erwies sich TF-IDF mit logistischer Regression bei Hunderten von Autoren als überlegen in Bezug auf Genauigkeit und Stabilität.

36