← heapsort-ai

language models

103 items

NEWSDEV.to AI·hace 16d

AI Daily Digest: May 25, 2026 — Grok Build CLI, Cursor Composer 2.5, Qwen 3.7, X-Humanoid Wise KaiWu & More

El Grok Build CLI de xAI se lanzó en beta temprana, ofreciendo 8 subagentes paralelos y una ventana de contexto de 2 millones de tokens. El Composer 2.5 de Cursor alcanzó la disponibilidad general, demostrando paridad con modelos avanzados en tareas de codificación, y el Qwen 3.7-Max-Preview de Alibaba introdujo una ventana de contexto de 1 millón de tokens con un modo de pensamiento extendido.

27
RESEARCHarXiv CS.CL·4/5/2026

RSAT: Structured Attribution Makes Small Language Models Faithful Table Reasoners

RSAT es un nuevo método que entrena pequeños modelos de lenguaje (SLM) para producir razonamiento fiel y paso a paso para preguntas de tablas, fundamentado con citas a nivel de celda. Mejora significativamente la fidelidad (3.7x) y logra una validez de citación casi perfecta al integrar la atribución en el proceso de razonamiento.

27
RESEARCHarXiv CS.CL·hace 22d

Why are language models less surprised than humans? Testing the Parse Multiplicity Mismatch Hypothesis

Este artículo investiga por qué los modelos de lenguaje muestran menos "sorpresa" que los humanos al procesar oraciones sintácticamente ambiguas. Prueba la hipótesis de que los LMs pueden considerar simultáneamente un mayor número de interpretaciones de oraciones utilizando Gramáticas de Red Neuronal Recurrente.

27
RESEARCHarXiv CS.AI·22/4/2026

Beyond One Output: Visualizing and Comparing Distributions of Language Model Generations

Este artículo de investigación aborda la limitación de los usuarios que interactúan con modelos de lenguaje solo a través de salidas únicas, lo que oculta la distribución completa de posibles generaciones. Presenta GROVE, una visualización interactiva que representa múltiples generaciones de LM como rutas superpuestas en un gráfico de texto, revelando la estructura compartida y los puntos de ramificación para una mejor comprensión.

27
RESEARCHarXiv CS.CL·hace 26d

Differences in Text Generated by Diffusion and Autoregressive Language Models

Esta investigación examina las diferencias inherentes en el texto generado por Modelos de Lenguaje de Difusión (DLM) y Modelos de Lenguaje Autorregresivos (ARM), encontrando que los DLM muestran menor entropía n-grama, pero mayor coherencia y diversidad semántica. Experimentos controlados indican que los objetivos de entrenamiento de los DLM contribuyen a la coherencia y diversidad semántica, mientras que los algoritmos de decodificación son responsables de la reducción de la entropía.

27
NEWSDEV.to AI·hace 18d

6.4 Claim Puts Nemotron-Labs Diffusion in AI Fast Lane

Nemotron-Labs Diffusion de NVIDIA busca acelerar las aplicaciones de IA abordando el cuello de botella de un token mediante la generación paralela de múltiples tokens. Este nuevo modelo de lenguaje de difusión afirma lograr hasta 6.4 veces más tokens por pasada directa, beneficiando significativamente a productos de IA sensibles a la latencia como asistentes de codificación y flujos de trabajo de agentes.

27
RESEARCHDEV.to AI·hace 17d

The Entropy Mechanism of Reinforcement Learning for Reasoning Language Models

Esta investigación explora el mecanismo de entropía del aprendizaje por refuerzo, específicamente su aplicación para mejorar las capacidades de razonamiento en los modelos de lenguaje. Investiga cómo se puede aprovechar la entropía para mejorar el proceso de aprendizaje y la toma de decisiones para un razonamiento más sólido en los modelos de lenguaje.

27
RESEARCHDEV.to AI·hace 26d

Generative Simulation Benchmarking for heritage language revitalization programs for extreme data sparsity scenarios

El texto aborda el desafío de construir modelos de lenguaje para lenguas patrimoniales en peligro crítico con escasez extrema de datos. El autor relata su experiencia personal con un conjunto de datos minúsculo para una lengua como el Halkomelem, subrayando la necesidad de enfoques novedosos para tales escenarios.

27
ARTICLEDEV.to AI·2/5/2026

The Aunty Test - what Marathi-speaking patients see when they ask Health AI in their own language

Este artículo subraya cómo la mayoría de las IAs de salud, diseñadas primero en inglés, fallan al manejar consultas médicas en idiomas locales como el maratí. Destaca la necesidad de IAs que razonen nativamente en múltiples idiomas para proporcionar orientación precisa, en lugar de depender de capas de traducción o "chapados" localizados.

27
RESEARCHDEV.to AI·9/5/2026

Hierarchical skill KB improves performance of weaker models

Una nueva pipeline automatizada, SkillX, mejora el rendimiento de los agentes autónomos de modelos de lenguaje al extraer comportamientos jerárquicos reutilizables de trayectorias colectivas. Esta base de conocimiento de tres niveles (habilidades estratégicas, funcionales y atómicas) permite que los modelos más débiles recuperen experiencias de manera eficiente, superando las limitaciones de los métodos tradicionales.

27
RESEARCHDEV.to AI·8/5/2026

Micro LM delivers large‑model quality on device

Un nuevo estudio presenta los Micro Language Models (μLMs), modelos ultracompactos (8M–30M parámetros) que ofrecen la calidad de modelos grandes en dispositivos. Este enfoque resuelve el dilema entre respuestas rápidas y completas en asistentes de borde, al iniciar las respuestas localmente y reducir la latencia de los modelos en la nube.

27
ARTICLEDEV.to AI·24/4/2026

Architecting Your AI Stack for Instant HS Codes and Customs Docs

Este contenido describe un flujo de trabajo de IA en capas para automatizar la compleja documentación aduanera y la generación de códigos HS, eliminando las cargas administrativas manuales y mejorando la escalabilidad en el comercio internacional. Aprovecha modelos de lenguaje avanzados para la extracción de datos y plataformas de automatización de flujos de trabajo para la generación de documentos.

27