← heapsort-ai

language models

103 items

RESEARCHarXiv CS.AI·hace 7d

MindGames Arena Generalization Track: In2AI Solution with Delayed Per-Step Reward Attribution

Esta investigación introduce un nuevo método de atribución de recompensa por paso retrasada para entrenar agentes de modelos de lenguaje en interacciones estratégicas multiagente. Aborda el desafío de los resultados entrelazados calculando las recompensas al final del episodio y propagándolas, lo que permite un aprendizaje por refuerzo estable y eficiente en muestras.

27
RESEARCHarXiv CS.CL·hace 26d

Correct Answers from Sound Reasoning: Verifiable Process Supervision for Language Models

Este artículo propone la Supervisión de Proceso Verificable (VPS), un marco de post-entrenamiento para optimizar conjuntamente la precisión de predicción y la calidad del razonamiento en modelos de lenguaje. VPS emplea ajuste fino supervisado para inducir un formato de razonamiento estructurado, evaluando afirmaciones intermedias con señales de verdad fundamental y ponderación adaptativa de recompensas.

27
RESEARCHarXiv CS.CL·hace 27d

The Bicameral Model: Bidirectional Hidden-State Coupling Between Parallel Language Models

El Modelo Bicameral acopla dos modelos de lenguaje preentrenados y congelados mediante una interfaz neuronal entrenable en sus estados ocultos intermedios, permitiéndoles operar en sincronía. Este método permite que un modelo principal dirija una tarea mientras un modelo auxiliar utiliza herramientas o resuelve restricciones, mejorando significativamente la precisión en tareas como la aritmética y los rompecabezas de lógica.

27
RESEARCHarXiv CS.CL·hace 8d

Domain Adaptation and Reasoning Frameworks in Language Models: A Controlled Experiment with Historical Cosmology

Esta investigación explora cómo la adaptación de dominio remodela el comportamiento explicativo en modelos de lenguaje, utilizando la cosmología histórica como un entorno controlado. El estudio implica entrenar un modelo pequeño desde cero y ajustar un modelo más grande para analizar el marco explicativo y la postura cosmológica.

27
RESEARCHarXiv CS.AI·8/4/2026

MMORF: A Multi-agent Framework for Designing Multi-objective Retrosynthesis Planning Systems

Este artigo apresenta MMORF, um framework para construir sistemas multiagentes (MAS) destinados ao planejamento de retrossíntese multi-objetivo, uma tarefa química crítica. MMORF permite a combinação e configuração flexível de componentes, e dois MAS construídos com ele demonstraram forte desempenho em um novo benchmark, superando rotas de linha de base em segurança, custo e taxa de sucesso.

27
RESEARCHarXiv CS.LG·6/4/2026

SIEVE: Sample-Efficient Parametric Learning from Natural Language

SIEVE propõe um método para aprendizado paramétrico com eficiência de amostra a partir de contexto de linguagem natural, necessitando de apenas três exemplos de consulta. Ele emprega uma pipeline de geração de dados sintéticos, SIEVE-GEN, que decompõe o contexto para gerar resultados de maior qualidade e destilar o contexto no modelo.

27
RESEARCHarXiv CS.CL·6/4/2026

Reinforcement Learning-based Knowledge Distillation with LLM-as-a-Judge

Este artigo propõe uma estrutura de Reinforcement Learning (RL) que utiliza um LLM como juiz para gerar recompensas, permitindo a destilação de conhecimento sem a necessidade de rótulos de verdade fundamental. A abordagem demonstra ganhos substanciais de desempenho em benchmarks de raciocínio matemático, sugerindo que avaliadores baseados em LLM podem produzir sinais de treinamento eficazes.

27
RESEARCHarXiv CS.CL·6/5/2026

Sparse Memory Finetuning as a Low-Forgetting Alternative to LoRA and Full Finetuning

Sparse Memory Finetuning (SMF) aborda el olvido catastrófico en modelos de lenguaje preentrenados actualizando solo un pequeño subconjunto de filas de memoria. Los experimentos muestran que SMF mejora el rendimiento en una tarea de examen médico y mitiga sustancialmente el olvido en comparación con LoRA y el ajuste fino completo.

27
RESEARCHarXiv CS.CL·6/5/2026

When Should a Language Model Trust Itself? Same-Model Self-Verification as a Conditional Confidence Signal

Esta investigación evalúa la auto-verificación del mismo modelo como una señal de confianza para la predicción selectiva, comparándola con líneas de base basadas en probabilidad. El estudio revela resultados dependientes de la tarea y del modelo, mostrando mejoras significativas para algunos modelos en ARC-Challenge, pero menor fiabilidad y degradación ocasional en TruthfulQA-MC.

27
RESEARCHarXiv CS.CL·hace 28d

How Much Do Circuits Tell Us? Measuring the Consistency and Specificity of Language Model Circuits

Este artículo mide la consistencia y especificidad de los circuitos de modelos de lenguaje utilizando el parche de atribución de bordes en múltiples tareas y modelos. Encuentra una alta reutilización de circuitos dentro de la tarea necesaria para el rendimiento, pero también una superposición significativa entre tareas, lo que indica que los circuitos no son específicos de la tarea.

27