← heapsort-ai

NLP

124 items

ARTICLE↑ trendingReddit r/MachineLearning·4/23/2026

Built a normalizer so WER stops penalizing formatting differences in STT evals! [P]

Dieser Inhalt befasst sich mit dem Problem, dass die Wortfehlerrate (WER) Formatierungsunterschiede bei STT-Bewertungen bestraft, was zu ungenauen Ergebnissen führt. Um dies zu beheben, wurde die Open-Source-Bibliothek `gladia-normalization` veröffentlicht, die Transkripte vor der WER-Berechnung normalisiert und so eine fairere Bewertung der Erkennungsqualität gewährleistet.

42
RESEARCHarXiv CS.CL·vor 18T

PromptNCE: Pointwise Mutual Information Predictions Using Only LLMs and Contrastive Estimation Prompts

Diese Arbeit stellt PromptNCE vor, eine Methode zur Schätzung der punktweisen gegenseitigen Information (PMI) unter Verwendung von nur LLMs und kontrastiven Schätzungsprompts, wodurch die Notwendigkeit aufgabenspezifischer Kritiker entfällt. Sie präsentiert einen Benchmark mit von Menschen abgeleiteter PMI und zeigt, dass PromptNCE eine Spearman-Korrelation von bis zu 0,82 erreicht.

33
RESEARCHarXiv CS.CL·4/16/2026

Text-as-Signal: Quantitative Semantic Scoring with Embeddings, Logprobs, and Noise Reduction

Dieses Papier stellt eine praktische Pipeline vor, um Textkorpora mithilfe von Embeddings, Logprob-basierter Evaluation und Rauschunterdrückung in quantitative semantische Signale umzuwandeln. Die Fallstudie wendet sechs semantische Dimensionen auf portugiesische Nachrichtenartikel über KI an, um Aufgaben des KI-Engineerings wie Korpusinspektion und -überwachung zu unterstützen.

30
RESEARCHDEV.to AI·4/13/2026

TALM: Tool Augmented Language Models

TALM (Tool Augmented Language Models) konzentriert sich auf die Integration externer Werkzeuge mit großen Sprachmodellen, um deren Fähigkeiten zu erweitern. Dieser Ansatz ermöglicht es LLMs, komplexe Aufgaben effektiver zu bewältigen, indem sie spezialisierte Funktionen und reale Interaktionen nutzen.

30
ARTICLEDEV.to AI·4/15/2026

How We Built 1,000+ AI Personas for Telegram Comments

Dieser Artikel beschreibt den Bau eines KI-Systems, das über 1.000 einzigartige Personas für Telegram-Kommentare generiert, nachdem menschliche Teams gescheitert waren. Er detailliert die Schaffung persistenter Persönlichkeiten mit natürlichem Verhalten und die Überwindung technischer Herausforderungen wie Anti-Bot-Systeme und KI-gestützte Spam-Moderation.

30
RESEARCHarXiv CS.AI·4/7/2026

Beyond Predefined Schemas: TRACE-KG for Context-Enriched Knowledge Graphs from Complex Documents

TRACE-KG é um framework multimodal que constrói grafos de conhecimento enriquecidos por contexto e um esquema induzido, superando limitações de métodos baseados em ontologias ou esquemas livres. Ele organiza entidades e relações usando um esquema guiado por dados, mantendo a rastreabilidade e capturando relações condicionais.

29
RESEARCHDEV.to AI·4/18/2026

Braille-D-FUMT8 vs CLIP / BERT / ImageBind: a Rigorous Information-Theoretic Comparison

Dieser Artikel, eine Neuveröffentlichung des Rei-AIOS Papiers 110, präsentiert einen rigorosen informationstheoretischen Vergleich zwischen der Braille-Unicode × D-FUMT8 Kodierung und multimodalen Embedding-Schemata wie CLIP, BERT und ImageBind. Die Forschung untersucht die Darstellung von 256 philosophischen Zuständen innerhalb eines einzelnen 3-Byte UTF-8 Zeichens.

29
RESEARCHarXiv CS.CL·4/9/2026

Consistency-Guided Decoding with Proof-Driven Disambiguation for Three-Way Logical Question Answering

Este conteúdo apresenta CGD-PD, uma camada leve para modelos de linguagem grandes (LLMs) que melhora a resposta a perguntas lógicas de três vias (Verdadeiro/Falso/Desconhecido). Ele aborda falhas recorrentes como inconsistência de negação e previsões 'Desconhecido' epistêmicas, utilizando decisões consistentes e desambiguação baseada em prova para maior precisão.

29
RESEARCHarXiv CS.CL·vor 7T

SENSE: Semantic Embedding Navigation with Soft-gated Evaluation for Retrieval-based Speculative Decoding

Dieses Papier schlägt SENSE (Semantic Embedding Navigation with Soft-gated Evaluation) vor, um Retrieval-basierte Spekulative Dekodierung (RSD) für LLMs zu verbessern. SENSE adressiert die starren lexikalischen Abhängigkeiten von RSD, indem es robuste semantische Ausrichtung und ein Soft-gated Evaluationsmodul verwendet, um semantische Äquivalenz zu validieren.

29
RESEARCHarXiv CS.AI·vor 4T

Synthetic Contrastive Reasoning for Multi-Table Q&A

Die Studie stellt einen synthetischen Kontrastiv-Reasoning-Trace-Datensatz für Multi-Tabellen-Frage-Antwort-Systeme (MMQA) vor, um die in bestehenden Ressourcen fehlende Reasoning-Supervision zu adressieren. Offene LLMs, die mit Contrastive Preference Optimization (CPO) unter Verwendung dieses Datensatzes feinabgestimmt wurden, zeigten signifikante Leistungsverbesserungen.

28