language models

103 items

NEWSDEV.to AI·il y a 16j

AI Daily Digest: May 25, 2026 — Grok Build CLI, Cursor Composer 2.5, Qwen 3.7, X-Humanoid Wise KaiWu & More

Le Grok Build CLI de xAI a été lancé en version bêta anticipée, proposant 8 sous-agents parallèles et une fenêtre contextuelle de 2 millions de tokens. Le Composer 2.5 de Cursor a atteint la disponibilité générale, démontrant une parité avec les modèles avancés pour les tâches de codage, et le Qwen 3.7-Max-Preview d'Alibaba a introduit une fenêtre contextuelle d'un million de tokens avec un mode de réflexion étendu.

language models Agentic Workflows AI coding tools developer tools

RESEARCHarXiv CS.CL·04/05/2026

RSAT: Structured Attribution Makes Small Language Models Faithful Table Reasoners

RSAT est une nouvelle méthode qui entraîne de petits modèles linguistiques (SLM) à produire un raisonnement fidèle et étape par étape pour les questions de tableau, étayé par des citations au niveau des cellules. Elle améliore significativement la fidélité (3.7x) et atteint une validité de citation quasi parfaite en intégrant l'attribution dans le processus de raisonnement.

language models attribution Table Reasoning model training

RESEARCHarXiv CS.CL·il y a 22j

Why are language models less surprised than humans? Testing the Parse Multiplicity Mismatch Hypothesis

Cet article examine pourquoi les modèles linguistiques sont moins « surpris » que les humains lors du traitement de phrases syntaxiquement ambiguës. Il teste l'hypothèse selon laquelle les modèles de langage peuvent considérer simultanément un plus grand nombre d'interprétations de phrases en utilisant les Grammaires de Réseaux Neuronaux Récurrents.

syntactic-ambiguity language models cognitive science NLP

RESEARCHarXiv CS.AI·22/04/2026

Beyond One Output: Visualizing and Comparing Distributions of Language Model Generations

Cet article de recherche aborde la limitation des utilisateurs qui interagissent avec les modèles linguistiques uniquement via des sorties uniques, ce qui masque la distribution complète des générations possibles. Il présente GROVE, une visualisation interactive qui représente plusieurs générations de modèles de langage comme des chemins superposés dans un graphe de texte, révélant la structure partagée et les points de ramification pour une meilleure compréhension.

language models Visualization human-AI interaction AI evaluation

RESEARCHarXiv CS.CL·il y a 26j

Differences in Text Generated by Diffusion and Autoregressive Language Models

Cette recherche explore les différences intrinsèques dans le texte généré par les Modèles de Langage à Diffusion (DLM) et les Modèles de Langage Autorégressifs (ARM), constatant que les DLM présentent une entropie n-gramme inférieure mais une cohérence et une diversité sémantiques plus élevées. Des expériences contrôlées révèlent que les objectifs d'entraînement des DLM améliorent la cohérence et la diversité grâce au contexte bidirectionnel, tandis que les algorithmes de décodage sont responsables de la réduction de l'entropie.

Diffusion Models language models NLP text generation

ARTICLEHugging Face Blog·il y a 6j

Direct Preference Optimization Beyond Chatbots

Cet article explore l'optimisation des préférences directes (DPO), une méthode permettant d'aligner les modèles d'IA sur les préférences humaines, en examinant ses applications potentielles au-delà des chatbots traditionnels. Il examine comment le DPO peut être utilisé dans divers domaines de l'IA.

language models reinforcement learning learning DPO

NEWSDEV.to AI·il y a 18j

6.4 Claim Puts Nemotron-Labs Diffusion in AI Fast Lane

Le Nemotron-Labs Diffusion de NVIDIA vise à accélérer les applications d'IA en s'attaquant au goulot d'étranglement d'un seul token grâce à la génération parallèle de multiples tokens. Ce nouveau modèle de langage de diffusion prétend atteindre jusqu'à 6,4 fois plus de tokens par passage avant, bénéficiant considérablement aux produits d'IA sensibles à la latence tels que les assistants de codage et les flux de travail d'agents.

Diffusion Models language models AI NVIDIA

RESEARCHHugging Face Blog·il y a 18j

Towards Speed-of-Light Text Generation with Nemotron-Labs Diffusion Language Models

Ce contenu aborde le développement de modèles de langage de diffusion de Nemotron-Labs visant à atteindre une génération de texte à une vitesse exceptionnellement élevée. L'accent est mis sur les avancées techniques pour optimiser la rapidité de la production textuelle.

Diffusion Models language models Nemotron-Labs text generation

RESEARCHDEV.to AI·il y a 17j

The Entropy Mechanism of Reinforcement Learning for Reasoning Language Models

Cette recherche explore le mécanisme d'entropie de l'apprentissage par renforcement, spécifiquement son application pour améliorer les capacités de raisonnement dans les modèles de langage. Elle étudie comment l'entropie peut être exploitée pour améliorer le processus d'apprentissage et la prise de décision pour un raisonnement plus robuste des modèles de langage.

language models reinforcement learning learning Reasoning

RESEARCHDEV.to AI·il y a 26j

Generative Simulation Benchmarking for heritage language revitalization programs for extreme data sparsity scenarios

Le texte aborde le défi de construire des modèles linguistiques pour des langues patrimoniales en danger critique avec une extrême rareté de données. L'auteur relate son expérience personnelle avec un ensemble de données minuscule pour une langue comme le Halkomelem, soulignant la nécessité de nouvelles approches pour de tels scénarios.

language models Natural Language Processing Data Sparsity endangered languages

ARTICLEDEV.to AI·il y a 18j

TokenJuice and the 20-Minute Cron: Inside OpenHuman’s Aggressive Context-Harvesting Engine

L'article détaille le moteur agressif de "récolte de contexte" d'OpenHuman, TokenJuice, qui agit comme un parasite de mémoire pour les modèles linguistiques. Il extrait, condense et réutilise continuellement le contexte de l'activité de l'utilisateur pour l'inférence future de l'IA.

language models AI architecture AI tooling memory persistence

RESEARCHDEV.to AI·il y a 23j

Glean benchmark: Off-the-shelf MCP costs 30% more tokens than indexed context

Un nouveau benchmark de Glean dans Claude Cowork indique que les serveurs MCP prêts à l'emploi échouent 2,5 fois plus souvent et consomment 30 % de jetons en plus que la couche de contexte indexée de Glean. Les utilisateurs ont également signalé avoir réduit leurs factures de jetons Claude de 30 % grâce à l'approche de Glean.

language models Claude Cowork AI Efficiency Benchmarks

RESEARCHDEV.to AI·04/05/2026

Molecular representation learning with language models and domain-relevantauxiliary tasks

Cette recherche explore l'apprentissage de la représentation moléculaire en utilisant des modèles de langage et en intégrant des tâches auxiliaires pertinentes au domaine. L'objectif est d'améliorer la compréhension et les capacités prédictives des propriétés moléculaires.

language models molecular representation learning machine learning cheminformatics

ARTICLEDEV.to AI·02/05/2026

The Aunty Test - what Marathi-speaking patients see when they ask Health AI in their own language

Cet article souligne comment la plupart des IA de santé, conçues en anglais, échouent à gérer les requêtes médicales dans des langues locales comme le marathi. Il insiste sur la nécessité d'IA qui raisonnent nativement dans plusieurs langues pour fournir des conseils précis, par opposition aux approches de traduction ou de "vernissage" localisé.

language models Multilingual AI AI bias healthcare AI

ARTICLEDEV.to AI·il y a 11j

I Pointed Chrome's Prompt API at a 1.25 Million Character Memoir, and It Got Interesting Fast

L'auteur a développé Gemini Nano Book Lab, une extension Chrome utilisant l'API Prompt pour interagir avec un modèle de langage embarqué sur un long mémoire. L'expérience étudie le comportement du modèle, les coûts de récupération et les limites de l'API lors du traitement de volumes de texte importants.

language models Chrome on-device AI Gemini Nano

ARTICLEDEV.to AI·09/04/2026

How AI Text Detection Works Under the Hood: Perplexity, Burstiness, and Classifiers

Este artigo explica como os detectores de texto de IA funcionam, analisando a previsibilidade do texto gerado por modelos de linguagem. Ele detalha que textos humanos são estatisticamente mais imprevisíveis e que os detectores exploram essa diferença usando sinais como perplexidade e 'burstiness'.

language models text analysis Perplexity AI detection

RESEARCHDEV.to AI·09/05/2026

Hierarchical skill KB improves performance of weaker models

Un nouveau pipeline automatisé, SkillX, améliore les performances des agents autonomes de modèles de langage en extrayant des comportements hiérarchiques réutilisables à partir de trajectoires collectives. Cette base de connaissances à trois niveaux (compétences stratégiques, fonctionnelles et atomiques) permet aux modèles plus faibles de récupérer efficacement les expériences, surmontant les limitations des méthodes traditionnelles.

language models model performance AI models machine learning

RESEARCHDEV.to AI·08/05/2026

Micro LM delivers large‑model quality on device

Une nouvelle étude présente les Micro Language Models (μLMs), des modèles ultra-compacts (8M–30M paramètres) qui offrent la qualité des grands modèles sur les appareils. Cette approche résout le dilemme entre des premiers mots réactifs et des réponses complètes pour les assistants de périphérie, en amorçant les réponses localement et en réduisant la latence des modèles cloud.

language models micro LMs Edge AI on-device AI

ARTICLEDEV.to AI·24/04/2026

Architecting Your AI Stack for Instant HS Codes and Customs Docs

Ce contenu décrit un flux de travail d'IA en couches pour automatiser la documentation douanière complexe et la génération de codes HS, éliminant les tâches administratives manuelles et améliorant l'évolutivité du commerce international. Il utilise des modèles linguistiques avancés pour l'extraction de données et des plateformes d'automatisation des flux de travail pour la génération de documents.

language models workflow automation customs clearance international trade

RESEARCHarXiv CS.CL·10/04/2026

CAMO: A Class-Aware Minority-Optimized Ensemble for Robust Language Model Evaluation on Imbalanced Data

CAMO é uma nova técnica de ensemble otimizada para dados desbalanceados, que impulsiona classes minoritárias e melhora o desempenho geral. Avaliada em benchmarks com diferentes modelos de linguagem, CAMO consistentemente atinge a maior pontuação F1 macro, estabelecendo um novo padrão.

language models ensemble methods F1-score class imbalance