← heapsort-ai

natural language processing

167 items

RESEARCHarXiv CS.CL·4/6/2026

Dependency-Guided Parallel Decoding in Discrete Diffusion Language Models

Modelos de linguagem de difusão discreta (dLLMs) aceleram a geração de texto, mas a decodificação paralela degrada a qualidade ao desconsiderar a dependência entre tokens. DEMASK propõe um preditor leve que estima influências condicionais para guiar o desmascaramento simultâneo, comprovadamente melhorando a qualidade. A técnica resulta em um ganho de velocidade de 1.7 a 2.2x, mantendo ou superando o desempenho.

29
RESEARCHarXiv CS.CL·vor 4T

Efficient Punctuation Restoration via Weighted Lookahead Scoring Method for Streaming ASR Systems

Dieses Papier stellt eine nicht-autoregressive Bewertungsmethode zur effizienten Interpunktionswiederherstellung in Streaming-ASR-Systemen vor. Es vergleicht Interpunktionseinfügehypothesen mit einer Nicht-Einfüge-Baseline unter Verwendung eines begrenzten K-Subwort-Token-Lookaheads und übertrifft prompt-basierte Ansätze.

28
RESEARCHDEV.to AI·vor 22T

Solving Math Word Problems by Combining Language Models With Symbolic Solvers

Diese Forschung untersucht einen neuartigen Ansatz zur Lösung mathematischer Textaufgaben durch die Kombination der Leistungsfähigkeit von Sprachmodellen mit der Präzision symbolischer Löser. Die Methode zielt darauf ab, sowohl das Verständnis natürlicher Sprache als auch formale mathematische Argumentation zu nutzen, um robuste Lösungen zu erzielen.

28
ARTICLEDEV.to AI·4/23/2026

How to Cross-Examination in a Click: Finding Inconsistencies Across Witness Statements

Dieser Inhalt beschreibt, wie KI die komplexe Aufgabe automatisieren kann, Inkonsistenzen in mehreren Zeugenaussagen für gerichtliche Kreuzverhöre zu finden. Die Methode beinhaltet den Übergang von der Zusammenfassung einzelner Aussagen zu einer einheitlichen Vergleichsanalyse durch die Ausrichtung von Entitäten und Ereignissen.

28
DOCAWS Machine Learning Blog·vor 19T

Integrating AWS API MCP Server with Amazon Quick using Amazon Bedrock AgentCore Runtime

Dieser Beitrag zeigt, wie Amazon Quick über den AWS API MCP Server mit AWS-Diensten unter Verwendung des Amazon Bedrock AgentCore Runtime mit MCP-Unterstützung verbunden werden kann. Er demonstriert die Erstellung eines konversationellen KI-Assistenten, der natürliche Sprache in AWS CLI-Befehle übersetzt, um Arbeitsabläufe zu optimieren.

28
RESEARCHarXiv CS.AI·4/15/2026

Narrative-Driven Paper-to-Slide Generation via ArcDeck

ArcDeck ist ein Multi-Agenten-KI-Framework, das Präsentationen aus wissenschaftlichen Arbeiten generiert, indem es den logischen Fluss und die narrative Struktur des Papiers explizit modelliert. Es nutzt einen Diskursbaum und iterative agentenbasierte Verfeinerung, um Kohärenz zu gewährleisten, und zeigt signifikante Verbesserungen bei den generierten Präsentationen.

28
RESEARCHarXiv CS.CL·vor 6T

Fixing FOLIO and MALLS: Verified Annotations and an LLM-assisted Framework to Focus Human Relabeling

Eine systematische Überprüfung der Validierungsaufteilungen von extsf{FOLIO} und extsf{MALLS} zeigte hohe Raten inkorrekter FOL-Formalisierungen und mehrdeutiger NL-Sätze, die die Bewertung von KI-Modellen verzerren. Die Autoren entwickelten und veröffentlichten korrigierte Ground Truths für diese Datensätze und zeigten, wie Annotationsfehler die Bewertung modernster LLMs beeinflussen.

28
RESEARCHarXiv CS.CL·vor 22T

Greedy or not, here I come: Language production under vocabulary constraints in humans and resource-rational models

Diese Forschung untersucht, wie Menschen mit begrenztem Wortschatz kommunizieren, und vergleicht ihre Strategien mit computationalen Stichprobenalgorithmen, die von großen Sprachmodellen angetrieben werden. Die Studie zeigt, dass die menschliche Sprachproduktion unter Einschränkungen oft dem Greedy-Sampling ähnelt, obwohl erfahrenere Personen nicht-greedy Revisionsverhalten zeigen.

28
RESEARCHarXiv CS.CL·vor 22T

Fluency and Faithfulness in Human and Machine Literary Translation

Diese Studie untersucht das Gleichgewicht zwischen Flüssigkeit und Treue in der literarischen Übersetzung, indem sie menschliche Übersetzungen, Google Translate und TranslateGemma von 106 Romanen in 16 Sprachen vergleicht. Sie zeigt eine konsistente negative Korrelation zwischen Flüssigkeit und Treue, die bei menschlichen und Google Translate Übersetzungen stärker ist, und betont, dass die Segmentlänge für die automatische Bewertung wichtig ist.

28
RESEARCHarXiv CS.CL·vor 15T

Learnability-Informed Fine-Tuning of Diffusion Language Models

Diese Forschung stellt LIFT vor, einen lerbarkeitsinformierten Fine-Tuning-Algorithmus, der entwickelt wurde, um die Schlussfolgerungsfähigkeiten von Diffusions-Sprachmodellen zu verbessern. LIFT behebt Mängel des Standard-SFT, indem es Token adaptiv basierend auf deren Schwierigkeit und dem verfügbaren Kontext während verschiedener Diffusionszeitschritte lernt und dabei eine verbesserte Leistung gegenüber bestehenden Baselines zeigt.

28
ARTICLEDEV.to AI·5/1/2026

From Mumbles to Memos: Teaching AI to Decipher Technician Voice Notes

Dieser Artikel behandelt den Produktivitätsengpass, der durch das manuelle Entziffern von Sprachnotizen von Technikern entsteht, und schlägt KI als Lösung vor, um Feldaufnahmen in professionelle Zusammenfassungen umzuwandeln. Er beschreibt eine Methodik, das 'Actionable Framework: The 3-Part Jargon List', um die KI darin zu schulen, spezifische Informationen aus unstrukturierten Audiodaten zu kategorisieren.

27