language models

103 items

RESEARCHarXiv CS.CL·hace 1d

Data-Efficient Autoregressive-to-Diffusion Language Models via On-Policy Distillation

Este artículo presenta el Modelo de Lenguaje de Difusión On-Policy (OPDLM) para transformar modelos autorregresivos (ARLMs) en modelos de lenguaje de difusión (DLMs). Aborda problemas como la pérdida de conocimiento y el desajuste entre entrenamiento e inferencia mediante el uso de la Destilación On-Policy (OPD).

Diffusion Models language models AI models machine learning

NEWS↑ trendingReddit r/LocalLLaMA·17/4/2026

Ternary Bonsai: Top intelligence at 1.58 bits

Prism ML ha anunciado Ternary Bonsai, una nueva familia de modelos de lenguaje de 1.58 bits diseñada para equilibrar estrictas restricciones de memoria con alta precisión. Estos modelos, disponibles en tamaños de 8B, 4B y 1.7B, logran una huella de memoria 9 veces menor que los modelos de 16 bits, superando a la mayoría de sus pares.

Model Compression language models Efficient AI

Ternary Bonsai: Top intelligence at 1.58 bits

RESEARCH↑ trendingReddit r/LocalLLaMA·hace 27d

sensenova/SenseNova-U1-A3B-MoT · Hugging Face

SenseNova U1 es una nueva serie de modelos multimodales nativos que unifica la comprensión, el razonamiento y la generación multimodal dentro de una arquitectura monolítica. Estos modelos innovadores piensan y actúan de forma nativa a través del lenguaje y la visión, marcando un cambio de paradigma fundamental en la IA multimodal.

language models multimodal AI unified architecture SenseNova

sensenova/SenseNova-U1-A3B-MoT · Hugging Face

ARTICLE↑ trendingReddit r/MachineLearning·21/4/2026

Bulding my own Diffusion Language Model from scratch was easier than I thought [P]

El autor construyó un modelo de lenguaje de difusión desde cero para comprender mejor conceptos complejos, sin la ayuda de código generado por IA. Entrenó el modelo de 7.5M parámetros con el pequeño conjunto de datos de Shakespeare y compartió el código en GitHub.

Diffusion Models language models personal-project machine learning

RESEARCHarXiv CS.CL·hace 1d

How Language Models Fail: Token-Level Signatures of Committed and Persistent Reasoning Failures

Las fallas en el razonamiento de los modelos de lenguaje surgen a través de procesos distintos que dejan firmas identificables a nivel de token. Estas fallas se caracterizan como "falla comprometida" o "incertidumbre persistente", y comprender estas firmas ayuda a distinguir los resultados fallidos de los exitosos en varias configuraciones.

language models research Reasoning AI failures

ARTICLEKDNuggets·hace 4d

A Deep Dive into Calibration of Language Models: Platt Scaling, Isotonic Regression, Temperature Scaling

Este contenido explora tres métodos post-hoc, como Platt Scaling, Isotonic Regression y Temperature Scaling, diseñados para mejorar la calibración de los modelos de lenguaje. Estas técnicas buscan reducir la disparidad entre la confianza predicha por un modelo y su precisión real.

language models Calibration learning machine learning

A Deep Dive into Calibration of Language Models: Platt Scaling, Isotonic Regression, Temperature Scaling

RESEARCHarXiv CS.CL·22/4/2026

Remask, Don't Replace: Token-to-Mask Refinement in Masked Diffusion Language Models

Este artículo propone una nueva técnica, Token-to-Mask (T2M) remasking, para refinar modelos de lenguaje de difusión enmascarados como LLaDA2.1. El método aborda las deficiencias de la edición Token-to-Token (T2T) al restablecer los tokens sospechosos a un estado de máscara, permitiendo una predicción más precisa.

Diffusion Models language models error correction natural language processing

RESEARCHarXiv CS.LG·hace 5d

Self-Distilled Policy Gradient

Este artículo introduce el Self-Distilled Policy Gradient (SDPG), un marco novedoso que mejora el aprendizaje por refuerzo de recompensa dispersa mediante la autodestilación on-policy. SDPG integra ventajas de verificador relativas al grupo, autodestilación exacta de vocabulario completo y regularización KL, demostrando una estabilidad y rendimiento superiores a los métodos base.

language models deep learning reinforcement learning Policy Gradient

RESEARCHarXiv CS.CL·hace 14d

AERIC: Anticipatory Hidden-State Monitoring for Implicit Harmful Dialogue

Este artículo presenta AERIC, un nuevo enfoque de estado oculto para el monitoreo anticipatorio y de pasada única de diálogos dañinos implícitos en modelos de lenguaje. Su objetivo es detectar riesgos potenciales lo suficientemente temprano para evitar la exposición de continuaciones perjudiciales.

harmful dialogue language models security AI safety

RESEARCHarXiv CS.CL·hace 4d

Predict and Reconstruct: Joint Objectives for Self-Supervised Language Representation Learning

Este artículo presenta un objetivo de pre-entrenamiento híbrido para codificadores de texto, que combina una pérdida de predicción de espacio latente al estilo JEPA con un objetivo estándar de modelado de lenguaje enmascarado (MLM). Este nuevo enfoque busca fomentar representaciones ancladas en estructuras semánticas más profundas en lugar de solo la identidad superficial de los tokens, mostrando incrustaciones significativamente más uniformes.

language models deep learning self-supervised learning machine learning

RESEARCHarXiv CS.CL·hace 4d

Generic Triple-Latent Compression with Gated Associative Retrieval

Esta investigación introduce modelos de secuencia genéricos triplemente latentes, que utilizan un estado de token en ejecución y memoria de par comprimida para capturar interacciones de tokens de orden superior. Estos modelos muestran mejoras sobre una línea base de Transformer en benchmarks de modelos de lenguaje, aunque una extensión de recuperación mejora la recuperación pero es más lenta.

language models latent models sequence models associative retrieval

RESEARCHDEV.to AI·13/4/2026

TALM: Tool Augmented Language Models

TALM (Tool Augmented Language Models) se enfoca en la integración de herramientas externas con grandes modelos de lenguaje para aumentar sus capacidades. Este enfoque permite a los LLMs realizar tareas complejas de manera más efectiva, aprovechando funciones especializadas e interacciones del mundo real.

language models LLMs NLP Tool Augmentation

RESEARCHarXiv CS.CL·hace 19d

Data Scaling as Progressive Coverage of a Predictive Contribution Spectrum

Esta investigación explora si las leyes de escalamiento de datos reales están gobernadas por una cobertura progresiva de un espectro latente de contribución predictiva, en lugar de solo por la frecuencia de tokens. Utilizando un autómata de sufijos y un espectro de contribución predictiva global-KL, el estudio encuentra una fuerte correlación entre la pendiente de la cola del espectro y el exponente de escalamiento de datos de los aprendices GPT, demostrando que el rango de truncamiento efectivo escala logarítmicamente.

language models data scaling machine learning predictive models

RESEARCHarXiv CS.CL·13/4/2026

Re-Mask and Redirect: Exploiting Denoising Irreversibility in Diffusion Language Models

El artículo revela una vulnerabilidad crítica en los modelos de lenguaje basados en difusión (dLLMs) donde su alineación de seguridad, basada en programas de denoising monotónicos, puede ser fácilmente eludida. Al volver a enmascarar tokens de rechazo e inyectar un prefijo afirmativo, los investigadores lograron altas tasas de éxito de ataque contra dLLMs destacados, exponiendo una falla estructural.

Diffusion Models language models vulnerability Exploitation

RESEARCHarXiv CS.AI·hace 20d

Learn-by-Wire Training Control Governance: Bounded Autonomous Training Under Stress for Stability and Efficiency

Este artículo presenta Learn-by-Wire Guard (LBW-Guard), una capa de gobernanza de control de entrenamiento autónomo para modelos de lenguaje. Su objetivo es mejorar la estabilidad y eficiencia del entrenamiento, reduciendo significativamente la perplejidad final.

language models deep learning AI training model stability

RESEARCHarXiv CS.CL·24/4/2026

GRISP: Guided Recurrent IRI Selection over SPARQL Skeletons

GRISP es un novedoso método de respuesta a preguntas basado en SPARQL sobre grafos de conocimiento, que utiliza un pequeño modelo de lenguaje (SLM) ajustado. Genera esqueletos de consultas SPARQL a partir de preguntas en lenguaje natural y los refina seleccionando elementos del grafo, logrando resultados de vanguardia en benchmarks como Wikidata y Freebase.

language models Knowledge Graphs SPARQL Question Answering

RESEARCHarXiv CS.AI·hace 29d

When Does a Language Model Commit? A Finite-Answer Theory of Pre-Verbalization Commitment

Esta investigación propone una teoría de "estabilización de preferencia de respuesta finita" para identificar el momento en que la preferencia de respuesta de un modelo de lenguaje se vuelve estable. Muestra que esta estabilización ocurre a menudo antes de que la respuesta sea verbalizada, con un tiempo de anticipación notable.

language models cognitive science machine learning NLP

RESEARCHarXiv CS.CL·hace 22d

Neural Activation Patterns Across Language Model Architectures: A Comprehensive Analysis of Cognitive Task Performance

Este artículo presenta un análisis exhaustivo de los patrones de activación neural en seis arquitecturas distintas de modelos de lenguaje grandes (LLM), examinando su rendimiento en doce categorías de tareas cognitivas. Los hallazgos revelan diferencias fundamentales en cómo las arquitecturas de codificador y decodificador procesan diversas tareas cognitivas, con el razonamiento matemático produciendo la mayor entropía de atención y los modelos decodificadores mostrando una esparsidad significativamente mayor.

neural networks language models cognitive science Model Analysis

RESEARCHarXiv CS.LG·hace 15d

The Readout Shortcut: Positional Number Copying Dominates Arithmetic CoT Readout in Small Language Models

Este estudio de investigación revela que los modelos de lenguaje pequeños (LMs) ajustados por instrucción que utilizan Chain-of-Thought (CoT) para la aritmética a menudo emplean un atajo posicional, copiando el número que ocupa la última posición antes del delimitador de la respuesta. Este atajo domina, incluso si el razonamiento intermedio es correcto, afectando significativamente la precisión de la respuesta.

language models CoT Prompting Arithmetic

RESEARCHarXiv CS.CL·hace 5d

Discourse-Role Labels as Presentation-Time Variables for Context Use in Language Models

Este estudio investiga el efecto de las etiquetas de rol de discurso, como "Referencia" o "Instrucción", en el comportamiento de los modelos de lenguaje. Revela que la tasa de adopción de información engañosa puede cambiar significativamente (56-84 puntos porcentuales) según la etiqueta, con etiquetas como "Instrucción" aumentando la adopción y "Ejemplo" suprimiéndola constantemente.

language models Context NLP model behavior