← heapsort-ai

language models

103 items

NEWSDEV.to AI·il y a 16j

AI Daily Digest: May 25, 2026 — Grok Build CLI, Cursor Composer 2.5, Qwen 3.7, X-Humanoid Wise KaiWu & More

Le Grok Build CLI de xAI a été lancé en version bêta anticipée, proposant 8 sous-agents parallèles et une fenêtre contextuelle de 2 millions de tokens. Le Composer 2.5 de Cursor a atteint la disponibilité générale, démontrant une parité avec les modèles avancés pour les tâches de codage, et le Qwen 3.7-Max-Preview d'Alibaba a introduit une fenêtre contextuelle d'un million de tokens avec un mode de réflexion étendu.

27
RESEARCHarXiv CS.CL·04/05/2026

RSAT: Structured Attribution Makes Small Language Models Faithful Table Reasoners

RSAT est une nouvelle méthode qui entraîne de petits modèles linguistiques (SLM) à produire un raisonnement fidèle et étape par étape pour les questions de tableau, étayé par des citations au niveau des cellules. Elle améliore significativement la fidélité (3.7x) et atteint une validité de citation quasi parfaite en intégrant l'attribution dans le processus de raisonnement.

27
RESEARCHarXiv CS.CL·il y a 22j

Why are language models less surprised than humans? Testing the Parse Multiplicity Mismatch Hypothesis

Cet article examine pourquoi les modèles linguistiques sont moins « surpris » que les humains lors du traitement de phrases syntaxiquement ambiguës. Il teste l'hypothèse selon laquelle les modèles de langage peuvent considérer simultanément un plus grand nombre d'interprétations de phrases en utilisant les Grammaires de Réseaux Neuronaux Récurrents.

27
RESEARCHarXiv CS.AI·22/04/2026

Beyond One Output: Visualizing and Comparing Distributions of Language Model Generations

Cet article de recherche aborde la limitation des utilisateurs qui interagissent avec les modèles linguistiques uniquement via des sorties uniques, ce qui masque la distribution complète des générations possibles. Il présente GROVE, une visualisation interactive qui représente plusieurs générations de modèles de langage comme des chemins superposés dans un graphe de texte, révélant la structure partagée et les points de ramification pour une meilleure compréhension.

27
RESEARCHarXiv CS.CL·il y a 26j

Differences in Text Generated by Diffusion and Autoregressive Language Models

Cette recherche explore les différences intrinsèques dans le texte généré par les Modèles de Langage à Diffusion (DLM) et les Modèles de Langage Autorégressifs (ARM), constatant que les DLM présentent une entropie n-gramme inférieure mais une cohérence et une diversité sémantiques plus élevées. Des expériences contrôlées révèlent que les objectifs d'entraînement des DLM améliorent la cohérence et la diversité grâce au contexte bidirectionnel, tandis que les algorithmes de décodage sont responsables de la réduction de l'entropie.

27
NEWSDEV.to AI·il y a 18j

6.4 Claim Puts Nemotron-Labs Diffusion in AI Fast Lane

Le Nemotron-Labs Diffusion de NVIDIA vise à accélérer les applications d'IA en s'attaquant au goulot d'étranglement d'un seul token grâce à la génération parallèle de multiples tokens. Ce nouveau modèle de langage de diffusion prétend atteindre jusqu'à 6,4 fois plus de tokens par passage avant, bénéficiant considérablement aux produits d'IA sensibles à la latence tels que les assistants de codage et les flux de travail d'agents.

27
RESEARCHDEV.to AI·il y a 17j

The Entropy Mechanism of Reinforcement Learning for Reasoning Language Models

Cette recherche explore le mécanisme d'entropie de l'apprentissage par renforcement, spécifiquement son application pour améliorer les capacités de raisonnement dans les modèles de langage. Elle étudie comment l'entropie peut être exploitée pour améliorer le processus d'apprentissage et la prise de décision pour un raisonnement plus robuste des modèles de langage.

27
RESEARCHDEV.to AI·il y a 26j

Generative Simulation Benchmarking for heritage language revitalization programs for extreme data sparsity scenarios

Le texte aborde le défi de construire des modèles linguistiques pour des langues patrimoniales en danger critique avec une extrême rareté de données. L'auteur relate son expérience personnelle avec un ensemble de données minuscule pour une langue comme le Halkomelem, soulignant la nécessité de nouvelles approches pour de tels scénarios.

27
ARTICLEDEV.to AI·02/05/2026

The Aunty Test - what Marathi-speaking patients see when they ask Health AI in their own language

Cet article souligne comment la plupart des IA de santé, conçues en anglais, échouent à gérer les requêtes médicales dans des langues locales comme le marathi. Il insiste sur la nécessité d'IA qui raisonnent nativement dans plusieurs langues pour fournir des conseils précis, par opposition aux approches de traduction ou de "vernissage" localisé.

27
RESEARCHDEV.to AI·09/05/2026

Hierarchical skill KB improves performance of weaker models

Un nouveau pipeline automatisé, SkillX, améliore les performances des agents autonomes de modèles de langage en extrayant des comportements hiérarchiques réutilisables à partir de trajectoires collectives. Cette base de connaissances à trois niveaux (compétences stratégiques, fonctionnelles et atomiques) permet aux modèles plus faibles de récupérer efficacement les expériences, surmontant les limitations des méthodes traditionnelles.

27
RESEARCHDEV.to AI·08/05/2026

Micro LM delivers large‑model quality on device

Une nouvelle étude présente les Micro Language Models (μLMs), des modèles ultra-compacts (8M–30M paramètres) qui offrent la qualité des grands modèles sur les appareils. Cette approche résout le dilemme entre des premiers mots réactifs et des réponses complètes pour les assistants de périphérie, en amorçant les réponses localement et en réduisant la latence des modèles cloud.

27
ARTICLEDEV.to AI·24/04/2026

Architecting Your AI Stack for Instant HS Codes and Customs Docs

Ce contenu décrit un flux de travail d'IA en couches pour automatiser la documentation douanière complexe et la génération de codes HS, éliminant les tâches administratives manuelles et améliorant l'évolutivité du commerce international. Il utilise des modèles linguistiques avancés pour l'extraction de données et des plateformes d'automatisation des flux de travail pour la génération de documents.

27