language models

105 items

RESEARCHarXiv CS.CL·4/22/2026

Probing for Reading Times

Diese Forschung untersucht Sprachmodellrepräsentationen auf menschliche Lesezeiten in fünf Sprachen und vergleicht sie mit skalaren Prädiktoren. Es zeigt sich, dass frühe Schichten der Sprachmodelle die Überraschung bei der Vorhersage von Frühpass-Lesemaßen übertreffen, was eine funktionale Ausrichtung zwischen Modelltiefe und den zeitlichen Stadien des menschlichen Lesens nahelegt.

language models human-computer interaction cognitive science Natural Language Processing

RESEARCHarXiv CS.CL·4/22/2026

Scripts Through Time: A Survey of the Evolving Role of Transliteration in NLP

Dieses Papier untersucht die Rolle der Transliteration in der NLP, eine entscheidende Technik zur Überwindung der „Schriftbarriere“ im sprachübergreifenden Transfer. Es präsentiert eine Taxonomie von Motivationen und Ansätzen, analysiert deren Wirksamkeit und ordnet ihre Notwendigkeit in modernen LLMs ein.

Cross-lingual AI language models LLMs NLP

NEWSDEV.to AI·vor 16T

AI Daily Digest: May 25, 2026 — Grok Build CLI, Cursor Composer 2.5, Qwen 3.7, X-Humanoid Wise KaiWu & More

xAIs Grok Build CLI wurde in einer frühen Beta-Phase veröffentlicht und bietet 8 parallele Subagenten sowie ein 2-Millionen-Token-Kontextfenster. Cursors Composer 2.5 erreichte die allgemeine Verfügbarkeit und zeigte Gleichwertigkeit mit fortgeschrittenen Modellen bei Codierungsaufgaben, während Alibabas Qwen 3.7-Max-Preview ein 1-Millionen-Token-Kontextfenster mit einem erweiterten Denkmodus einführte.

language models Agentic Workflows AI coding tools developer tools

RESEARCHarXiv CS.CL·5/4/2026

RSAT: Structured Attribution Makes Small Language Models Faithful Table Reasoners

RSAT ist eine neue Methode, die kleine Sprachmodelle (SLMs) trainiert, um eine getreue, schrittweise Argumentation für Tabellenfragen zu erstellen, die mit zellgenauen Zitaten untermauert ist. Sie verbessert die Treue erheblich (3,7-fach) und erreicht eine nahezu perfekte Zitiergültigkeit, indem die Attribuierung in den Denkprozess integriert wird.

language models attribution Table Reasoning model training

RESEARCHarXiv CS.CL·vor 23T

Why are language models less surprised than humans? Testing the Parse Multiplicity Mismatch Hypothesis

Diese Arbeit untersucht, warum Sprachmodelle bei syntaktisch mehrdeutigen Sätzen weniger „überrascht“ sind als Menschen. Sie testet die Hypothese, dass Sprachmodelle gleichzeitig eine größere Anzahl von Satzinterpretationen berücksichtigen können, indem sie rekurrente neuronale Netzgrammatiken verwenden.

syntactic-ambiguity language models cognitive science NLP

RESEARCHarXiv CS.AI·4/22/2026

Beyond One Output: Visualizing and Comparing Distributions of Language Model Generations

Diese Forschungsarbeit behandelt die Einschränkung, dass Benutzer mit Sprachmodellen nur über einzelne Ausgaben interagieren, was die vollständige Verteilung möglicher Generierungen verbirgt. Sie stellt GROVE vor, eine interaktive Visualisierung, die mehrere LM-Generierungen als überlappende Pfade in einem Textgraphen darstellt und so gemeinsame Strukturen und Verzweigungspunkte für ein besseres Verständnis offenbart.

language models Visualization human-AI interaction AI evaluation

RESEARCHarXiv CS.CL·vor 27T

Differences in Text Generated by Diffusion and Autoregressive Language Models

Diese Forschung untersucht die intrinsischen Unterschiede in Texten, die von Diffusions-Sprachmodellen (DLMs) und autoregressiven Sprachmodellen (ARMs) generiert werden, und stellt fest, dass DLMs eine geringere n-Gramm-Entropie, aber eine höhere semantische Kohärenz und Diversität aufweisen. Kontrollierte Experimente zeigen, dass die Trainingsziele von DLMs zur Erhöhung der semantischen Kohärenz und Diversität beitragen, während die Dekodierungsalgorithmen für die Entropiereduktion verantwortlich sind.

Diffusion Models language models NLP text generation

ARTICLEHugging Face Blog·vor 6T

Direct Preference Optimization Beyond Chatbots

Dieser Artikel untersucht die Direct Preference Optimization (DPO), eine Methode zur Anpassung von KI-Modellen an menschliche Präferenzen, und erforscht ihre potenziellen Anwendungen jenseits traditioneller Chatbots. Er befasst sich damit, wie DPO in verschiedenen KI-Bereichen eingesetzt werden kann.

language models reinforcement learning learning DPO

NEWSDEV.to AI·vor 18T

6.4 Claim Puts Nemotron-Labs Diffusion in AI Fast Lane

NVIDIAs Nemotron-Labs Diffusion zielt darauf ab, KI-Anwendungen zu beschleunigen, indem der Engpass eines Tokens durch parallele Generierung mehrerer Tokens behoben wird. Dieses neue Diffusions-Sprachmodell beansprucht bis zu 6,4-mal höhere Tokens pro Forward-Pass und kommt damit latenzempfindlichen KI-Produkten wie Coding-Assistenten und Agenten-Workflows erheblich zugute.

Diffusion Models language models AI NVIDIA

RESEARCHHugging Face Blog·vor 18T

Towards Speed-of-Light Text Generation with Nemotron-Labs Diffusion Language Models

Dieser Inhalt behandelt die Entwicklung von Nemotron-Labs' Diffusions-Sprachmodellen zur Erzeugung von Text mit außergewöhnlich hoher Geschwindigkeit. Der Fokus liegt auf technischen Fortschritten zur Optimierung der Geschwindigkeit der Textproduktion.

Diffusion Models language models Nemotron-Labs text generation

RESEARCHDEV.to AI·vor 17T

The Entropy Mechanism of Reinforcement Learning for Reasoning Language Models

Diese Forschung untersucht den Entropiemechanismus des Reinforcement Learning, insbesondere dessen Anwendung zur Verbesserung der Denkfähigkeiten in Sprachmodellen. Es wird erforscht, wie Entropie genutzt werden kann, um den Lernprozess und die Entscheidungsfindung für ein robusteres Sprachmodell-Denken zu optimieren.

language models reinforcement learning learning Reasoning

RESEARCHDEV.to AI·vor 26T

Generative Simulation Benchmarking for heritage language revitalization programs for extreme data sparsity scenarios

Der Text behandelt die Herausforderung, Sprachmodelle für kritisch bedrohte Kultursprachen unter extremen Datensparsamkeitsszenarien zu entwickeln. Der Autor schildert seine persönlichen Erfahrungen mit einem winzigen Datensatz für eine Sprache wie Halkomelem und betont die Notwendigkeit neuartiger Ansätze für solche Situationen.

language models Natural Language Processing Data Sparsity endangered languages

ARTICLEDEV.to AI·vor 18T

TokenJuice and the 20-Minute Cron: Inside OpenHuman’s Aggressive Context-Harvesting Engine

Der Artikel beschreibt OpenHumans aggressiven Kontext-Erfassungs-Engine, TokenJuice, der als Speicherparasit für Sprachmodelle fungiert. Er extrahiert, kondensiert und recycelt kontinuierlich Kontext aus Benutzeraktivitäten für zukünftige KI-Inferenz.

language models AI architecture AI tooling memory persistence

RESEARCHDEV.to AI·vor 23T

Glean benchmark: Off-the-shelf MCP costs 30% more tokens than indexed context

Ein neuer Glean-Benchmark in Claude Cowork zeigt, dass handelsübliche MCP-Server 2,5-mal häufiger fehlschlagen und 30% mehr Token verbrauchen als Gleans indizierte Kontextschicht. Benutzer berichteten auch, ihre Claude-Token-Rechnung um 30% gesenkt zu haben, indem sie Gleans Ansatz nutzten.

language models Claude Cowork AI Efficiency benchmarks

RESEARCHDEV.to AI·5/4/2026

Molecular representation learning with language models and domain-relevantauxiliary tasks

Diese Forschung untersucht das molekulare Repräsentationslernen mittels Sprachmodellen und durch die Einbeziehung domänenspezifischer Hilfsaufgaben. Ziel ist es, das Verständnis und die Vorhersagefähigkeiten für molekulare Eigenschaften zu verbessern.

language models molecular representation learning machine learning cheminformatics

ARTICLEDEV.to AI·5/2/2026

The Aunty Test - what Marathi-speaking patients see when they ask Health AI in their own language

Dieser Artikel beleuchtet, wie die meisten englischsprachigen KI-Gesundheitssysteme bei medizinischen Anfragen in lokalen Sprachen wie Marathi versagen. Er betont die Notwendigkeit von KI, die nativ in mehreren Sprachen argumentiert, anstatt sich auf Übersetzungs- oder lokalisierungsbasierte Ansätze zu verlassen, um genaue Gesundheitsberatung zu bieten.

language models Multilingual AI AI bias healthcare AI

ARTICLEDEV.to AI·vor 11T

I Pointed Chrome's Prompt API at a 1.25 Million Character Memoir, and It Got Interesting Fast

Der Autor entwickelte das Gemini Nano Book Lab, eine Chrome-Erweiterung, die die Prompt API nutzt, um mit einem On-Device-Sprachmodell über eine lange Memoiren zu interagieren. Das Experiment untersucht das Verhalten des Modells, die Abrufkosten und die Grenzen der API bei der Verarbeitung großer Textmengen.

language models Chrome on-device AI Gemini Nano

ARTICLEDEV.to AI·4/9/2026

How AI Text Detection Works Under the Hood: Perplexity, Burstiness, and Classifiers

Este artigo explica como os detectores de texto de IA funcionam, analisando a previsibilidade do texto gerado por modelos de linguagem. Ele detalha que textos humanos são estatisticamente mais imprevisíveis e que os detectores exploram essa diferença usando sinais como perplexidade e 'burstiness'.

language models text analysis Perplexity AI detection

RESEARCHDEV.to AI·5/9/2026

Hierarchical skill KB improves performance of weaker models

Eine neue automatisierte Pipeline, SkillX, verbessert die Leistung autonomer Sprachmodellagenten, indem sie wiederverwendbare, hierarchische Verhaltensweisen aus kollektiven Trajektorien extrahiert. Diese dreistufige Wissensbasis (strategische, funktionale, atomare Fähigkeiten) ermöglicht es schwächeren Modellen, Erfahrungen effizient abzurufen und so die Einschränkungen traditioneller Methoden zu überwinden.

language models model performance AI models machine learning

RESEARCHDEV.to AI·5/8/2026

Micro LM delivers large‑model quality on device

Eine neue Studie stellt Micro Language Models (μLMs) vor, ultrakompakte Modelle (8M–30M Parameter), die große Modellqualität auf Geräten liefern. Dieser Ansatz löst das Dilemma zwischen sofortiger erster Antwort und vollständiger, durchdachter Antwort bei Edge-Assistenten, indem Antworten lokal begonnen und die Latenz durch Cloud-Modelle reduziert werden.

language models micro LMs Edge AI on-device AI