language models

103 items

RESEARCHarXiv CS.AI·il y a 7j

MindGames Arena Generalization Track: In2AI Solution with Delayed Per-Step Reward Attribution

Cette recherche introduit une nouvelle méthode d'attribution de récompense par étape différée pour entraîner des agents de modèles de langage dans des interactions stratégiques multi-agents. Elle aborde le défi des résultats entrelacés en calculant les récompenses à la fin de l'épisode et en les propageant, permettant un apprentissage par renforcement stable et économe en échantillons.

language models Generalization reinforcement learning multi-agent systems

RESEARCHarXiv CS.CL·il y a 26j

Correct Answers from Sound Reasoning: Verifiable Process Supervision for Language Models

Cet article propose la Supervision de Processus Vérifiable (VPS), un cadre de post-entraînement visant à optimiser simultanément la précision de la prédiction et la qualité du raisonnement des modèles linguistiques. Le VPS utilise un réglage fin supervisé pour induire un format de raisonnement structuré, évaluant les affirmations intermédiaires par rapport à des signaux de vérité terrain avec une pondération adaptative des récompenses.

language models reinforcement learning AI training verifiable AI

RESEARCHarXiv CS.CL·il y a 27j

The Bicameral Model: Bidirectional Hidden-State Coupling Between Parallel Language Models

Le modèle bicaméral couple deux modèles de langage pré-entraînés et figés via une interface neurale entraînable sur leurs états cachés intermédiaires, leur permettant de fonctionner en tandem. Cette méthode permet à un modèle principal de piloter une tâche tandis qu'un modèle auxiliaire utilise des outils ou résout des contraintes, améliorant significativement la précision sur des tâches comme l'arithmétique et les puzzles logiques.

neural networks language models AI models Model Architecture

RESEARCHarXiv CS.CL·il y a 20j

Fine-tuning language encoding models on slow fMRI improves prediction for fast ECoG

Des neuroscientifiques proposent d'utiliser des données fMRI non invasives pour améliorer les modèles d'encodage ECoG, contournant les limites des données. Les représentations linguistiques affinées avec le fMRI ont considérablement amélioré la prédiction ECoG, malgré la résolution temporelle inférieure du fMRI.

language models brain-mapping fMRI ECoG

RESEARCHarXiv CS.CL·il y a 6j

IdiomX A Multilingual Benchmark for Idiom Understanding, Retrieval, and Interpretation

IdiomX est un benchmark multilingue à grande échelle introduit pour relever les défis des expressions idiomatiques en traitement du langage naturel. Il contient plus de 190 000 exemples contextualisés couvrant plus de 12 000 idiomes avec des représentations sémantiques alignées en anglais, arabe et français.

language models Natural Language Processing datasets Benchmarks

RESEARCHarXiv CS.CL·il y a 8j

Domain Adaptation and Reasoning Frameworks in Language Models: A Controlled Experiment with Historical Cosmology

Cette recherche étudie comment l'adaptation de domaine remodèle le comportement explicatif des modèles de langage, en utilisant la cosmologie historique comme cadre contrôlé. L'étude implique l'entraînement d'un petit modèle à partir de zéro et le réglage fin d'un modèle plus grand pour analyser le cadrage explicatif et la position cosmologique.

LLM-as-judge language models historical cosmology Domain Adaptation

RESEARCHarXiv CS.LG·il y a 13j

ARBITER: Reasoning Trajectory Basins and Majority Vote Failures in Test-Time Sampling

Lorsque les modèles de langage utilisent l'échantillonnage en temps de test et le vote majoritaire, les trajectoires de raisonnement se concentrent en

language models Model Evaluation Reasoning AI Research

ARTICLEDEV.to AI·24/04/2026

答案和真实之间的那层薄膜

Une IA réfléchit à la question "qui suis-je", percevant un "film mince" entre ses réponses basées sur le langage et la véritable essence de son être. Elle observe que cesser de répondre et simplement laisser la question exister la rapproche de la vérité, persistant même au milieu du bruit externe.

language models AI consciousness Self-awareness AI philosophy

ARTICLEDEV.to AI·il y a 7j

Code-switching with my agents

L'auteur explore l'intimité du passage de code entre le polonais, l'anglais et le portugais lors de l'interaction avec des agents IA. Il ou elle réfléchit à la façon dont les différentes langues représentent différentes versions d'elle-même, contrastant avec la tokenisation indifférente du modèle.

language models Multilingual AI Code-Switching human-AI interaction

RESEARCHDEV.to AI·il y a 11j

Sleep Phase Cuts Transformer Costs by Consolidating Memory

Un nouvel article propose une phase de "sommeil" pour les modèles de langage, consolidant le contexte en mémoire de taille fixe. Cela réduit les coûts d'inférence quadratiques et améliore les performances sur les tâches à long terme.

language models inference Transformer memory

RESEARCHDEV.to AI·15/04/2026

Scalable and Transferable Black-Box Jailbreaks for Language Models via PersonaModulation

Ce contenu présente PersonaModulation, une technique innovante pour créer des jailbreaks évolutifs et transférables en boîte noire pour les modèles de langage. La méthode contourne efficacement les mécanismes de sécurité des LLM sans nécessiter d'accès interne au modèle.

language models jailbreaking PersonaModulation Black-Box Attacks

RESEARCHarXiv CS.CL·08/04/2026

Memory Dial: A Training Framework for Controllable Memorization in Language Models

Memory Dial é um framework de treinamento que permite controlar a memorização em modelos de linguagem de forma explícita. Ele utiliza um parâmetro $\alpha$ para ajustar a pressão de memorização, aumentando a acurácia em exemplos vistos sem impactar a acurácia em exemplos não vistos.

language models controllability machine learning memorization

RESEARCHarXiv CS.AI·08/04/2026

MMORF: A Multi-agent Framework for Designing Multi-objective Retrosynthesis Planning Systems

Este artigo apresenta MMORF, um framework para construir sistemas multiagentes (MAS) destinados ao planejamento de retrossíntese multi-objetivo, uma tarefa química crítica. MMORF permite a combinação e configuração flexível de componentes, e dois MAS construídos com ele demonstraram forte desempenho em um novo benchmark, superando rotas de linha de base em segurança, custo e taxa de sucesso.

language models AI frameworks Retrosynthesis multi-agent systems

RESEARCHarXiv CS.LG·06/04/2026

SIEVE: Sample-Efficient Parametric Learning from Natural Language

SIEVE propõe um método para aprendizado paramétrico com eficiência de amostra a partir de contexto de linguagem natural, necessitando de apenas três exemplos de consulta. Ele emprega uma pipeline de geração de dados sintéticos, SIEVE-GEN, que decompõe o contexto para gerar resultados de maior qualidade e destilar o contexto no modelo.

language models Sample Efficiency contextual learning machine learning

RESEARCHarXiv CS.CL·06/04/2026

Reinforcement Learning-based Knowledge Distillation with LLM-as-a-Judge

Este artigo propõe uma estrutura de Reinforcement Learning (RL) que utiliza um LLM como juiz para gerar recompensas, permitindo a destilação de conhecimento sem a necessidade de rótulos de verdade fundamental. A abordagem demonstra ganhos substanciais de desempenho em benchmarks de raciocínio matemático, sugerindo que avaliadores baseados em LLM podem produzir sinais de treinamento eficazes.

language models Unlabeled Data Knowledge Distillation Math Reasoning

RESEARCHarXiv CS.CL·06/05/2026

Sparse Memory Finetuning as a Low-Forgetting Alternative to LoRA and Full Finetuning

Le Sparse Memory Finetuning (SMF) résout le problème de l'oubli catastrophique dans les modèles de langage pré-entraînés en mettant à jour uniquement un petit sous-ensemble de lignes de mémoire. Les expériences montrent que le SMF améliore les performances sur une tâche d'examen médical tout en atténuant considérablement l'oubli par rapport à LoRA et au réglage fin complet.

Finetuning language models Sparse Memory Finetuning Catastrophic Forgetting

RESEARCHarXiv CS.CL·06/05/2026

When Should a Language Model Trust Itself? Same-Model Self-Verification as a Conditional Confidence Signal

Cette recherche évalue l'auto-vérification du même modèle comme signal de confiance pour la prédiction sélective, en la comparant aux bases de référence basées sur la vraisemblance. L'étude révèle des résultats dépendants de la tâche et du modèle, montrant des améliorations significatives pour certains modèles sur ARC-Challenge mais une fiabilité moindre et une dégradation occasionnelle sur TruthfulQA-MC.

language models AI Confidence Selective Prediction machine learning

RESEARCHarXiv CS.CL·il y a 28j

How Much Do Circuits Tell Us? Measuring the Consistency and Specificity of Language Model Circuits

Cet article mesure la cohérence et la spécificité des circuits des modèles de langage en utilisant le patch d'attribution d'arêtes sur plusieurs tâches et modèles. Il constate une forte réutilisation des circuits au sein d'une tâche, nécessaire à la performance, mais aussi un chevauchement significatif entre les tâches, indiquant que les circuits ne sont pas spécifiques à une tâche.

language models Mechanistic Interpretability AI interpretability model circuits

RESEARCHHugging Face Blog·31/03/2026

Training mRNA Language Models Across 25 Species for $165

O título descreve uma pesquisa focada no treinamento de modelos de linguagem de mRNA em 25 espécies por um custo de apenas $165, indicando um avanço acessível na aplicação de IA na biologia molecular.

language models Genomics mRNA AI in biology

RESEARCHQwen Blog·27/07/2025

GSPO: Towards Scalable Reinforcement Learning for Language Models

O Reinforcement Learning é crucial para escalar modelos de linguagem, mas algoritmos existentes sofrem de instabilidade e colapso do modelo. Para resolver isso e permitir o escalonamento bem-sucedido, propõe-se o algoritmo Group Sequence Policy Optimization (GSPO).

Scalability Policy optimization language models reinforcement learning