← heapsort-ai

language models

103 items

RESEARCHarXiv CS.AI·il y a 7j

MindGames Arena Generalization Track: In2AI Solution with Delayed Per-Step Reward Attribution

Cette recherche introduit une nouvelle méthode d'attribution de récompense par étape différée pour entraîner des agents de modèles de langage dans des interactions stratégiques multi-agents. Elle aborde le défi des résultats entrelacés en calculant les récompenses à la fin de l'épisode et en les propageant, permettant un apprentissage par renforcement stable et économe en échantillons.

27
RESEARCHarXiv CS.CL·il y a 26j

Correct Answers from Sound Reasoning: Verifiable Process Supervision for Language Models

Cet article propose la Supervision de Processus Vérifiable (VPS), un cadre de post-entraînement visant à optimiser simultanément la précision de la prédiction et la qualité du raisonnement des modèles linguistiques. Le VPS utilise un réglage fin supervisé pour induire un format de raisonnement structuré, évaluant les affirmations intermédiaires par rapport à des signaux de vérité terrain avec une pondération adaptative des récompenses.

27
RESEARCHarXiv CS.CL·il y a 27j

The Bicameral Model: Bidirectional Hidden-State Coupling Between Parallel Language Models

Le modèle bicaméral couple deux modèles de langage pré-entraînés et figés via une interface neurale entraînable sur leurs états cachés intermédiaires, leur permettant de fonctionner en tandem. Cette méthode permet à un modèle principal de piloter une tâche tandis qu'un modèle auxiliaire utilise des outils ou résout des contraintes, améliorant significativement la précision sur des tâches comme l'arithmétique et les puzzles logiques.

27
RESEARCHarXiv CS.CL·il y a 8j

Domain Adaptation and Reasoning Frameworks in Language Models: A Controlled Experiment with Historical Cosmology

Cette recherche étudie comment l'adaptation de domaine remodèle le comportement explicatif des modèles de langage, en utilisant la cosmologie historique comme cadre contrôlé. L'étude implique l'entraînement d'un petit modèle à partir de zéro et le réglage fin d'un modèle plus grand pour analyser le cadrage explicatif et la position cosmologique.

27
RESEARCHarXiv CS.AI·08/04/2026

MMORF: A Multi-agent Framework for Designing Multi-objective Retrosynthesis Planning Systems

Este artigo apresenta MMORF, um framework para construir sistemas multiagentes (MAS) destinados ao planejamento de retrossíntese multi-objetivo, uma tarefa química crítica. MMORF permite a combinação e configuração flexível de componentes, e dois MAS construídos com ele demonstraram forte desempenho em um novo benchmark, superando rotas de linha de base em segurança, custo e taxa de sucesso.

27
RESEARCHarXiv CS.LG·06/04/2026

SIEVE: Sample-Efficient Parametric Learning from Natural Language

SIEVE propõe um método para aprendizado paramétrico com eficiência de amostra a partir de contexto de linguagem natural, necessitando de apenas três exemplos de consulta. Ele emprega uma pipeline de geração de dados sintéticos, SIEVE-GEN, que decompõe o contexto para gerar resultados de maior qualidade e destilar o contexto no modelo.

27
RESEARCHarXiv CS.CL·06/04/2026

Reinforcement Learning-based Knowledge Distillation with LLM-as-a-Judge

Este artigo propõe uma estrutura de Reinforcement Learning (RL) que utiliza um LLM como juiz para gerar recompensas, permitindo a destilação de conhecimento sem a necessidade de rótulos de verdade fundamental. A abordagem demonstra ganhos substanciais de desempenho em benchmarks de raciocínio matemático, sugerindo que avaliadores baseados em LLM podem produzir sinais de treinamento eficazes.

27
RESEARCHarXiv CS.CL·06/05/2026

Sparse Memory Finetuning as a Low-Forgetting Alternative to LoRA and Full Finetuning

Le Sparse Memory Finetuning (SMF) résout le problème de l'oubli catastrophique dans les modèles de langage pré-entraînés en mettant à jour uniquement un petit sous-ensemble de lignes de mémoire. Les expériences montrent que le SMF améliore les performances sur une tâche d'examen médical tout en atténuant considérablement l'oubli par rapport à LoRA et au réglage fin complet.

27
RESEARCHarXiv CS.CL·06/05/2026

When Should a Language Model Trust Itself? Same-Model Self-Verification as a Conditional Confidence Signal

Cette recherche évalue l'auto-vérification du même modèle comme signal de confiance pour la prédiction sélective, en la comparant aux bases de référence basées sur la vraisemblance. L'étude révèle des résultats dépendants de la tâche et du modèle, montrant des améliorations significatives pour certains modèles sur ARC-Challenge mais une fiabilité moindre et une dégradation occasionnelle sur TruthfulQA-MC.

27
RESEARCHarXiv CS.CL·il y a 28j

How Much Do Circuits Tell Us? Measuring the Consistency and Specificity of Language Model Circuits

Cet article mesure la cohérence et la spécificité des circuits des modèles de langage en utilisant le patch d'attribution d'arêtes sur plusieurs tâches et modèles. Il constate une forte réutilisation des circuits au sein d'une tâche, nécessaire à la performance, mais aussi un chevauchement significatif entre les tâches, indiquant que les circuits ne sont pas spécifiques à une tâche.

27