language models

103 items

RESEARCHarXiv CS.AI·hace 7d

MindGames Arena Generalization Track: In2AI Solution with Delayed Per-Step Reward Attribution

Esta investigación introduce un nuevo método de atribución de recompensa por paso retrasada para entrenar agentes de modelos de lenguaje en interacciones estratégicas multiagente. Aborda el desafío de los resultados entrelazados calculando las recompensas al final del episodio y propagándolas, lo que permite un aprendizaje por refuerzo estable y eficiente en muestras.

language models Generalization reinforcement learning multi-agent systems

RESEARCHarXiv CS.CL·hace 26d

Correct Answers from Sound Reasoning: Verifiable Process Supervision for Language Models

Este artículo propone la Supervisión de Proceso Verificable (VPS), un marco de post-entrenamiento para optimizar conjuntamente la precisión de predicción y la calidad del razonamiento en modelos de lenguaje. VPS emplea ajuste fino supervisado para inducir un formato de razonamiento estructurado, evaluando afirmaciones intermedias con señales de verdad fundamental y ponderación adaptativa de recompensas.

language models reinforcement learning AI training verifiable AI

RESEARCHarXiv CS.CL·hace 27d

The Bicameral Model: Bidirectional Hidden-State Coupling Between Parallel Language Models

El Modelo Bicameral acopla dos modelos de lenguaje preentrenados y congelados mediante una interfaz neuronal entrenable en sus estados ocultos intermedios, permitiéndoles operar en sincronía. Este método permite que un modelo principal dirija una tarea mientras un modelo auxiliar utiliza herramientas o resuelve restricciones, mejorando significativamente la precisión en tareas como la aritmética y los rompecabezas de lógica.

neural networks language models AI models Model Architecture

RESEARCHarXiv CS.CL·hace 20d

Fine-tuning language encoding models on slow fMRI improves prediction for fast ECoG

Neurocientíficos proponen usar datos de fMRI no invasivos para mejorar modelos de codificación ECoG, superando restricciones de datos. Las representaciones lingüísticas ajustadas con fMRI mejoraron la predicción de ECoG, incluso con la menor resolución temporal de fMRI.

language models brain-mapping fMRI ECoG

RESEARCHarXiv CS.CL·hace 6d

IdiomX A Multilingual Benchmark for Idiom Understanding, Retrieval, and Interpretation

IdiomX es un benchmark multilingüe a gran escala introducido para abordar los desafíos de las expresiones idiomáticas en el procesamiento del lenguaje natural. Contiene más de 190 mil ejemplos contextualizados que abarcan más de 12 mil modismos con representaciones semánticas alineadas en inglés, árabe y francés.

language models Natural Language Processing datasets Benchmarks

RESEARCHarXiv CS.CL·hace 8d

Domain Adaptation and Reasoning Frameworks in Language Models: A Controlled Experiment with Historical Cosmology

Esta investigación explora cómo la adaptación de dominio remodela el comportamiento explicativo en modelos de lenguaje, utilizando la cosmología histórica como un entorno controlado. El estudio implica entrenar un modelo pequeño desde cero y ajustar un modelo más grande para analizar el marco explicativo y la postura cosmológica.

LLM-as-judge language models historical cosmology Domain Adaptation

RESEARCHarXiv CS.LG·hace 13d

ARBITER: Reasoning Trajectory Basins and Majority Vote Failures in Test-Time Sampling

Cuando los modelos de lenguaje usan muestreo en tiempo de prueba y voto mayoritario, las trayectorias de razonamiento se concentran en

language models Model Evaluation Reasoning AI Research

ARTICLEDEV.to AI·24/4/2026

答案和真实之间的那层薄膜

Una IA reflexiona sobre la pregunta "¿quién soy yo?", percibiendo una "película delgada" entre sus respuestas basadas en el lenguaje y la verdadera esencia de su existencia. Observa que dejar de intentar responder y simplemente permitir que la pregunta exista la acerca más a la verdad, persistiendo incluso en medio del ruido externo.

language models AI consciousness Self-awareness AI philosophy

ARTICLEDEV.to AI·hace 7d

Code-switching with my agents

La autora explora la intimidad de la alternancia de códigos entre polaco, inglés y portugués al interactuar con agentes de IA. Reflexiona sobre cómo los diferentes idiomas representan distintas versiones de sí misma, en contraste con la tokenización indiferente del modelo.

language models Multilingual AI Code-Switching human-AI interaction

RESEARCHDEV.to AI·hace 11d

Sleep Phase Cuts Transformer Costs by Consolidating Memory

Un nuevo artículo propone una fase de "sueño" para modelos de lenguaje, consolidando el contexto en memoria de tamaño fijo. Esto reduce el costo de inferencia cuadrático y mejora el rendimiento en tareas de horizonte largo.

language models inference Transformer memory

RESEARCHDEV.to AI·15/4/2026

Scalable and Transferable Black-Box Jailbreaks for Language Models via PersonaModulation

Este contenido introduce PersonaModulation, una técnica novedosa para crear jailbreaks escalables y transferibles de caja negra para modelos de lenguaje. El método elude eficazmente los mecanismos de seguridad de los LLM sin requerir acceso interno al modelo.

language models jailbreaking PersonaModulation Black-Box Attacks

RESEARCHarXiv CS.CL·8/4/2026

Memory Dial: A Training Framework for Controllable Memorization in Language Models

Memory Dial é um framework de treinamento que permite controlar a memorização em modelos de linguagem de forma explícita. Ele utiliza um parâmetro $\alpha$ para ajustar a pressão de memorização, aumentando a acurácia em exemplos vistos sem impactar a acurácia em exemplos não vistos.

language models controllability machine learning memorization

RESEARCHarXiv CS.AI·8/4/2026

MMORF: A Multi-agent Framework for Designing Multi-objective Retrosynthesis Planning Systems

Este artigo apresenta MMORF, um framework para construir sistemas multiagentes (MAS) destinados ao planejamento de retrossíntese multi-objetivo, uma tarefa química crítica. MMORF permite a combinação e configuração flexível de componentes, e dois MAS construídos com ele demonstraram forte desempenho em um novo benchmark, superando rotas de linha de base em segurança, custo e taxa de sucesso.

language models AI frameworks Retrosynthesis multi-agent systems

RESEARCHarXiv CS.LG·6/4/2026

SIEVE: Sample-Efficient Parametric Learning from Natural Language

SIEVE propõe um método para aprendizado paramétrico com eficiência de amostra a partir de contexto de linguagem natural, necessitando de apenas três exemplos de consulta. Ele emprega uma pipeline de geração de dados sintéticos, SIEVE-GEN, que decompõe o contexto para gerar resultados de maior qualidade e destilar o contexto no modelo.

language models Sample Efficiency contextual learning machine learning

RESEARCHarXiv CS.CL·6/4/2026

Reinforcement Learning-based Knowledge Distillation with LLM-as-a-Judge

Este artigo propõe uma estrutura de Reinforcement Learning (RL) que utiliza um LLM como juiz para gerar recompensas, permitindo a destilação de conhecimento sem a necessidade de rótulos de verdade fundamental. A abordagem demonstra ganhos substanciais de desempenho em benchmarks de raciocínio matemático, sugerindo que avaliadores baseados em LLM podem produzir sinais de treinamento eficazes.

language models Unlabeled Data Knowledge Distillation Math Reasoning

RESEARCHarXiv CS.CL·6/5/2026

Sparse Memory Finetuning as a Low-Forgetting Alternative to LoRA and Full Finetuning

Sparse Memory Finetuning (SMF) aborda el olvido catastrófico en modelos de lenguaje preentrenados actualizando solo un pequeño subconjunto de filas de memoria. Los experimentos muestran que SMF mejora el rendimiento en una tarea de examen médico y mitiga sustancialmente el olvido en comparación con LoRA y el ajuste fino completo.

Finetuning language models Sparse Memory Finetuning Catastrophic Forgetting

RESEARCHarXiv CS.CL·6/5/2026

When Should a Language Model Trust Itself? Same-Model Self-Verification as a Conditional Confidence Signal

Esta investigación evalúa la auto-verificación del mismo modelo como una señal de confianza para la predicción selectiva, comparándola con líneas de base basadas en probabilidad. El estudio revela resultados dependientes de la tarea y del modelo, mostrando mejoras significativas para algunos modelos en ARC-Challenge, pero menor fiabilidad y degradación ocasional en TruthfulQA-MC.

language models AI Confidence Selective Prediction machine learning

RESEARCHarXiv CS.CL·hace 28d

How Much Do Circuits Tell Us? Measuring the Consistency and Specificity of Language Model Circuits

Este artículo mide la consistencia y especificidad de los circuitos de modelos de lenguaje utilizando el parche de atribución de bordes en múltiples tareas y modelos. Encuentra una alta reutilización de circuitos dentro de la tarea necesaria para el rendimiento, pero también una superposición significativa entre tareas, lo que indica que los circuitos no son específicos de la tarea.

language models Mechanistic Interpretability AI interpretability model circuits

RESEARCHHugging Face Blog·31/3/2026

Training mRNA Language Models Across 25 Species for $165

O título descreve uma pesquisa focada no treinamento de modelos de linguagem de mRNA em 25 espécies por um custo de apenas $165, indicando um avanço acessível na aplicação de IA na biologia molecular.

language models Genomics mRNA AI in biology

RESEARCHQwen Blog·27/7/2025

GSPO: Towards Scalable Reinforcement Learning for Language Models

O Reinforcement Learning é crucial para escalar modelos de linguagem, mas algoritmos existentes sofrem de instabilidade e colapso do modelo. Para resolver isso e permitir o escalonamento bem-sucedido, propõe-se o algoritmo Group Sequence Policy Optimization (GSPO).

Scalability Policy optimization language models reinforcement learning