language models

103 items

NEWSDEV.to AI·hace 16d

AI Daily Digest: May 25, 2026 — Grok Build CLI, Cursor Composer 2.5, Qwen 3.7, X-Humanoid Wise KaiWu & More

El Grok Build CLI de xAI se lanzó en beta temprana, ofreciendo 8 subagentes paralelos y una ventana de contexto de 2 millones de tokens. El Composer 2.5 de Cursor alcanzó la disponibilidad general, demostrando paridad con modelos avanzados en tareas de codificación, y el Qwen 3.7-Max-Preview de Alibaba introdujo una ventana de contexto de 1 millón de tokens con un modo de pensamiento extendido.

language models Agentic Workflows AI coding tools developer tools

RESEARCHarXiv CS.CL·4/5/2026

RSAT: Structured Attribution Makes Small Language Models Faithful Table Reasoners

RSAT es un nuevo método que entrena pequeños modelos de lenguaje (SLM) para producir razonamiento fiel y paso a paso para preguntas de tablas, fundamentado con citas a nivel de celda. Mejora significativamente la fidelidad (3.7x) y logra una validez de citación casi perfecta al integrar la atribución en el proceso de razonamiento.

language models attribution Table Reasoning model training

RESEARCHarXiv CS.CL·hace 22d

Why are language models less surprised than humans? Testing the Parse Multiplicity Mismatch Hypothesis

Este artículo investiga por qué los modelos de lenguaje muestran menos "sorpresa" que los humanos al procesar oraciones sintácticamente ambiguas. Prueba la hipótesis de que los LMs pueden considerar simultáneamente un mayor número de interpretaciones de oraciones utilizando Gramáticas de Red Neuronal Recurrente.

syntactic-ambiguity language models cognitive science NLP

RESEARCHarXiv CS.AI·22/4/2026

Beyond One Output: Visualizing and Comparing Distributions of Language Model Generations

Este artículo de investigación aborda la limitación de los usuarios que interactúan con modelos de lenguaje solo a través de salidas únicas, lo que oculta la distribución completa de posibles generaciones. Presenta GROVE, una visualización interactiva que representa múltiples generaciones de LM como rutas superpuestas en un gráfico de texto, revelando la estructura compartida y los puntos de ramificación para una mejor comprensión.

language models Visualization human-AI interaction AI evaluation

RESEARCHarXiv CS.CL·hace 26d

Differences in Text Generated by Diffusion and Autoregressive Language Models

Esta investigación examina las diferencias inherentes en el texto generado por Modelos de Lenguaje de Difusión (DLM) y Modelos de Lenguaje Autorregresivos (ARM), encontrando que los DLM muestran menor entropía n-grama, pero mayor coherencia y diversidad semántica. Experimentos controlados indican que los objetivos de entrenamiento de los DLM contribuyen a la coherencia y diversidad semántica, mientras que los algoritmos de decodificación son responsables de la reducción de la entropía.

Diffusion Models language models NLP text generation

ARTICLEHugging Face Blog·hace 6d

Direct Preference Optimization Beyond Chatbots

Este artículo explora la Optimización de Preferencia Directa (DPO), un método para alinear modelos de IA con preferencias humanas, examinando sus aplicaciones potenciales más allá de los chatbots tradicionales. Profundiza en cómo se puede utilizar DPO en varios dominios de IA.

language models reinforcement learning learning DPO

NEWSDEV.to AI·hace 18d

6.4 Claim Puts Nemotron-Labs Diffusion in AI Fast Lane

Nemotron-Labs Diffusion de NVIDIA busca acelerar las aplicaciones de IA abordando el cuello de botella de un token mediante la generación paralela de múltiples tokens. Este nuevo modelo de lenguaje de difusión afirma lograr hasta 6.4 veces más tokens por pasada directa, beneficiando significativamente a productos de IA sensibles a la latencia como asistentes de codificación y flujos de trabajo de agentes.

Diffusion Models language models AI NVIDIA

RESEARCHHugging Face Blog·hace 18d

Towards Speed-of-Light Text Generation with Nemotron-Labs Diffusion Language Models

Este contenido trata sobre el desarrollo de modelos de lenguaje de difusión de Nemotron-Labs con el objetivo de lograr una generación de texto a una velocidad excepcionalmente alta. Se centra en los avances técnicos para optimizar la rapidez de la producción textual.

Diffusion Models language models Nemotron-Labs text generation

RESEARCHDEV.to AI·hace 17d

The Entropy Mechanism of Reinforcement Learning for Reasoning Language Models

Esta investigación explora el mecanismo de entropía del aprendizaje por refuerzo, específicamente su aplicación para mejorar las capacidades de razonamiento en los modelos de lenguaje. Investiga cómo se puede aprovechar la entropía para mejorar el proceso de aprendizaje y la toma de decisiones para un razonamiento más sólido en los modelos de lenguaje.

language models reinforcement learning learning Reasoning

RESEARCHDEV.to AI·hace 26d

Generative Simulation Benchmarking for heritage language revitalization programs for extreme data sparsity scenarios

El texto aborda el desafío de construir modelos de lenguaje para lenguas patrimoniales en peligro crítico con escasez extrema de datos. El autor relata su experiencia personal con un conjunto de datos minúsculo para una lengua como el Halkomelem, subrayando la necesidad de enfoques novedosos para tales escenarios.

language models Natural Language Processing Data Sparsity endangered languages

ARTICLEDEV.to AI·hace 18d

TokenJuice and the 20-Minute Cron: Inside OpenHuman’s Aggressive Context-Harvesting Engine

El artículo detalla el agresivo motor de recolección de contexto de OpenHuman, TokenJuice, que funciona como un parásito de memoria para modelos de lenguaje. Extrae, condensa y reutiliza continuamente el contexto de la actividad del usuario para futuras inferencias de IA.

language models AI architecture AI tooling memory persistence

RESEARCHDEV.to AI·hace 23d

Glean benchmark: Off-the-shelf MCP costs 30% more tokens than indexed context

Un nuevo benchmark de Glean en Claude Cowork revela que los servidores MCP listos para usar fallan 2.5 veces más a menudo y consumen un 30% más de tokens que la capa de contexto indexado de Glean. Los usuarios también han informado de una reducción del 30% en las facturas de tokens de Claude al utilizar el enfoque de Glean.

language models Claude Cowork AI Efficiency Benchmarks

RESEARCHDEV.to AI·4/5/2026

Molecular representation learning with language models and domain-relevantauxiliary tasks

Esta investigación explora el aprendizaje de representación molecular utilizando modelos de lenguaje y tareas auxiliares relevantes para el dominio. El objetivo es mejorar la comprensión y la predicción de propiedades moleculares.

language models molecular representation learning machine learning cheminformatics

ARTICLEDEV.to AI·2/5/2026

The Aunty Test - what Marathi-speaking patients see when they ask Health AI in their own language

Este artículo subraya cómo la mayoría de las IAs de salud, diseñadas primero en inglés, fallan al manejar consultas médicas en idiomas locales como el maratí. Destaca la necesidad de IAs que razonen nativamente en múltiples idiomas para proporcionar orientación precisa, en lugar de depender de capas de traducción o "chapados" localizados.

language models Multilingual AI AI bias healthcare AI

ARTICLEDEV.to AI·hace 11d

I Pointed Chrome's Prompt API at a 1.25 Million Character Memoir, and It Got Interesting Fast

El autor creó Gemini Nano Book Lab, una extensión de Chrome que utiliza la API de Prompt para interactuar con un modelo de lenguaje en el dispositivo sobre un libro extenso. El experimento explora el comportamiento del modelo, los costos de recuperación y los límites de la API al procesar grandes volúmenes de texto.

language models Chrome on-device AI Gemini Nano

ARTICLEDEV.to AI·9/4/2026

How AI Text Detection Works Under the Hood: Perplexity, Burstiness, and Classifiers

Este artigo explica como os detectores de texto de IA funcionam, analisando a previsibilidade do texto gerado por modelos de linguagem. Ele detalha que textos humanos são estatisticamente mais imprevisíveis e que os detectores exploram essa diferença usando sinais como perplexidade e 'burstiness'.

language models text analysis Perplexity AI detection

RESEARCHDEV.to AI·9/5/2026

Hierarchical skill KB improves performance of weaker models

Una nueva pipeline automatizada, SkillX, mejora el rendimiento de los agentes autónomos de modelos de lenguaje al extraer comportamientos jerárquicos reutilizables de trayectorias colectivas. Esta base de conocimiento de tres niveles (habilidades estratégicas, funcionales y atómicas) permite que los modelos más débiles recuperen experiencias de manera eficiente, superando las limitaciones de los métodos tradicionales.

language models model performance AI models machine learning

RESEARCHDEV.to AI·8/5/2026

Micro LM delivers large‑model quality on device

Un nuevo estudio presenta los Micro Language Models (μLMs), modelos ultracompactos (8M–30M parámetros) que ofrecen la calidad de modelos grandes en dispositivos. Este enfoque resuelve el dilema entre respuestas rápidas y completas en asistentes de borde, al iniciar las respuestas localmente y reducir la latencia de los modelos en la nube.

language models micro LMs Edge AI on-device AI

ARTICLEDEV.to AI·24/4/2026

Architecting Your AI Stack for Instant HS Codes and Customs Docs

Este contenido describe un flujo de trabajo de IA en capas para automatizar la compleja documentación aduanera y la generación de códigos HS, eliminando las cargas administrativas manuales y mejorando la escalabilidad en el comercio internacional. Aprovecha modelos de lenguaje avanzados para la extracción de datos y plataformas de automatización de flujos de trabajo para la generación de documentos.

language models workflow automation customs clearance international trade

RESEARCHarXiv CS.CL·10/4/2026

CAMO: A Class-Aware Minority-Optimized Ensemble for Robust Language Model Evaluation on Imbalanced Data

CAMO é uma nova técnica de ensemble otimizada para dados desbalanceados, que impulsiona classes minoritárias e melhora o desempenho geral. Avaliada em benchmarks com diferentes modelos de linguagem, CAMO consistentemente atinge a maior pontuação F1 macro, estabelecendo um novo padrão.

language models ensemble methods F1-score class imbalance