NLP

124 items

DOC↑ trendingReddit r/LocalLLaMA·21/4/2026

ibm-granite/granite-4.1-8b · Hugging Face

Granite-4.1-8B es un modelo de instrucción de contexto largo de 8 mil millones de parámetros de IBM, mejorado mediante ajuste fino y alineación para capacidades avanzadas de llamada de herramientas, seguimiento de instrucciones y chat. Soporta múltiples idiomas y fue lanzado en abril de 2026 bajo la licencia Apache 2.0.

NLP natural language processing AI model Large Language Model

ibm-granite/granite-4.1-8b · Hugging Face

ARTICLE↑ trendingReddit r/MachineLearning·23/4/2026

Built a normalizer so WER stops penalizing formatting differences in STT evals! [P]

Este contenido aborda el problema de que la Tasa de Error de Palabras (WER) penaliza las diferencias de formato en las evaluaciones STT, lo que lleva a puntuaciones imprecisas. Para resolverlo, se lanzó la biblioteca de código abierto `gladia-normalization`, que normaliza las transcripciones antes del cálculo del WER, asegurando una evaluación más justa de la calidad del reconocimiento.

Open Source evaluation NLP Speech-to-Text

ARTICLE↑ trendingReddit r/MachineLearning·23/4/2026

First time fine-tuning, need a sanity check — 3B or 7B for multi-task reasoning? [D]

Un usuario autodidacta, principiante en el fine-tuning, pide consejo sobre la elección entre modelos LLM de 3B y 7B para un proyecto de razonamiento multitarea. El proyecto implica entender la intención subyacente en las preguntas, mantener múltiples perspectivas y manejar entradas desordenadas.

LLMs model selection multi-task reasoning NLP

RESEARCH↑ trendingReddit r/MachineLearning·22/4/2026

EMNLP workshop any good? Or any other NLP venue good for VLM eval work? [D]

El contenido pregunta sobre la idoneidad de los talleres de EMNLP para el trabajo de evaluación de modelos de visión-lenguaje (VLM). También busca recomendaciones de otros buenos lugares de PNL para este tipo de investigación.

evaluation VLM NLP research venues

RESEARCHarXiv CS.CL·hace 18d

PromptNCE: Pointwise Mutual Information Predictions Using Only LLMs and Contrastive Estimation Prompts

Este artículo presenta PromptNCE, un método para estimar la información mutua puntual (PMI) utilizando solo LLMs y prompts de estimación contrastiva, evitando la necesidad de críticos específicos de la tarea. Introduce un benchmark con PMI derivado de humanos y demuestra que PromptNCE logra una correlación de Spearman de hasta 0,82.

information theory LLMs prompt engineering machine learning

DOCDEV.to AI·16/4/2026

Automating Your Literature Review: From PDFs to Data with AI

Este contenido describe cómo la automatización con IA puede transformar las revisiones de literatura, haciendo que la detección y extracción de datos de PDFs sean más eficientes y reproducibles. Sugiere un enfoque iterativo y la combinación de herramientas como GROBID y spaCy para un flujo de trabajo práctico.

AI automation Data Extraction literature review NLP

ARTICLEDEV.to AI·19/4/2026

Building Conversational AI in Amharic: Lessons from Creating Ethiopia's First Voice AI Tutor

Una startup creó el primer tutor de IA de voz para el amárico, descubriendo que la traducción simple no funciona debido a las estructuras gramaticales y contextos culturales únicos del idioma. El proyecto enfrentó complejidades con el script Ge'ez y la escasez de datos de entrenamiento.

NLP amharic less-resourced-languages Conversational AI

DOCML Mastery·hace 4d

Building Semantic Search with Transformers.js and Sentence Embeddings

Este contenido aborda el problema común de búsquedas de usuarios que devuelven cero resultados debido a la falta de comprensión semántica. Propone la construcción de una búsqueda semántica utilizando Transformers.js y embeddings de frases para mejorar la relevancia de los resultados.

sentence embeddings search NLP Transformers.js

Building Semantic Search with Transformers.js and Sentence Embeddings

RESEARCHarXiv CS.CL·16/4/2026

Text-as-Signal: Quantitative Semantic Scoring with Embeddings, Logprobs, and Noise Reduction

Este artículo presenta un pipeline práctico para transformar corpora de texto en señales semánticas cuantitativas, utilizando embeddings, evaluación basada en logprobs y reducción de ruido. El estudio de caso aplica seis dimensiones semánticas a noticias portuguesas sobre IA para apoyar tareas de ingeniería de IA como la inspección y el monitoreo de corpus.

machine learning NLP embeddings semantic analysis

RESEARCHDEV.to AI·13/4/2026

TALM: Tool Augmented Language Models

TALM (Tool Augmented Language Models) se enfoca en la integración de herramientas externas con grandes modelos de lenguaje para aumentar sus capacidades. Este enfoque permite a los LLMs realizar tareas complejas de manera más efectiva, aprovechando funciones especializadas e interacciones del mundo real.

language models LLMs NLP Tool Augmentation

ARTICLEDEV.to AI·15/4/2026

How We Built 1,000+ AI Personas for Telegram Comments

Este artículo describe la construcción de un sistema de IA que genera más de 1.000 personas únicas para comentarios en Telegram, después de que los equipos humanos fallaran. Detalla la creación de personalidades persistentes con comportamiento natural y la superación de desafíos técnicos como los sistemas anti-bot y la moderación de spam con IA.

Telegram Personas NLP AI

RESEARCHarXiv CS.AI·7/4/2026

Beyond Predefined Schemas: TRACE-KG for Context-Enriched Knowledge Graphs from Complex Documents

TRACE-KG é um framework multimodal que constrói grafos de conhecimento enriquecidos por contexto e um esquema induzido, superando limitações de métodos baseados em ontologias ou esquemas livres. Ele organiza entidades e relações usando um esquema guiado por dados, mantendo a rastreabilidade e capturando relações condicionais.

multimodal AI schema induction Knowledge Graphs document understanding

ARTICLEDEV.to AI·18/4/2026

India's Homegrown AI Ecosystem: 110+ Apps Across 22 Languages and 28 Sectors

India se presenta como una gran oportunidad en el mercado de la IA, con más de 110 aplicaciones en 22 idiomas y 28 sectores, impulsada por una inversión de $3.8 mil millones. El país está cerrando la brecha de acceso lingüístico con modelos de IA propios y tiene una alta concentración de talento en IA.

market opportunity AI ecosystem India NLP

RESEARCHDEV.to AI·18/4/2026

Braille-D-FUMT8 vs CLIP / BERT / ImageBind: a Rigorous Information-Theoretic Comparison

Este artículo, una republicación del Rei-AIOS Paper 110, ofrece una rigurosa comparación informático-teórica entre la codificación Braille-Unicode × D-FUMT8 y esquemas de embedding multimodales como CLIP, BERT e ImageBind. La investigación explora la representación de 256 estados filosóficos en un solo carácter UTF-8 de 3 bytes.

information theory AI models multimodal AI NLP

ARTICLEKDNuggets·hace 4d

3 SpaCy Tricks for Efficient Text Processing & Entity Recognition

Este artículo explora tres trucos esenciales de spaCy para desarrolladores, con el objetivo de maximizar la velocidad de procesamiento. Se centra en personalizar el reconocimiento de entidades para flujos de trabajo eficientes.

text processing entity recognition NLP Python

3 SpaCy Tricks for Efficient Text Processing & Entity Recognition

RESEARCHarXiv CS.CL·9/4/2026

Consistency-Guided Decoding with Proof-Driven Disambiguation for Three-Way Logical Question Answering

Este conteúdo apresenta CGD-PD, uma camada leve para modelos de linguagem grandes (LLMs) que melhora a resposta a perguntas lógicas de três vias (Verdadeiro/Falso/Desconhecido). Ele aborda falhas recorrentes como inconsistência de negação e previsões 'Desconhecido' epistêmicas, utilizando decisões consistentes e desambiguação baseada em prova para maior precisão.

LLMs Question Answering consistency NLP

RESEARCHarXiv CS.AI·hace 29d

When Does a Language Model Commit? A Finite-Answer Theory of Pre-Verbalization Commitment

Esta investigación propone una teoría de "estabilización de preferencia de respuesta finita" para identificar el momento en que la preferencia de respuesta de un modelo de lenguaje se vuelve estable. Muestra que esta estabilización ocurre a menudo antes de que la respuesta sea verbalizada, con un tiempo de anticipación notable.

language models cognitive science machine learning NLP

RESEARCHarXiv CS.CL·hace 7d

SENSE: Semantic Embedding Navigation with Soft-gated Evaluation for Retrieval-based Speculative Decoding

Este artículo propone SENSE (Semantic Embedding Navigation with Soft-gated Evaluation) para mejorar la Decodificación Especulativa Basada en Recuperación (RSD) en LLMs. SENSE aborda las rígidas dependencias léxicas de RSD, utilizando alineación semántica y evaluación de puerta suave para validar la equivalencia semántica.

LLMs NLP Inference Optimization Speculative Decoding

RESEARCHarXiv CS.CL·7/4/2026

Are Arabic Benchmarks Reliable? QIMMA's Quality-First Approach to LLM Evaluation

QIMMA é uma nova plataforma de avaliação de LLMs em árabe que prioriza a qualidade, realizando validação sistemática de benchmarks. Ela resolve problemas de qualidade em benchmarks existentes através de revisão automatizada e humana, resultando em um conjunto de avaliação reprodutível e multi-tarefa com mais de 52 mil amostras.

Arabic LLM NLP Benchmarks Quality Assurance

RESEARCHarXiv CS.AI·hace 4d

Synthetic Contrastive Reasoning for Multi-Table Q&A

El artículo introduce un conjunto de datos sintético de rastreo de razonamiento contrastivo para la respuesta a preguntas multi-tabla (MMQA), con el objetivo de proporcionar supervisión de razonamiento que falta en los recursos existentes. Los LLM de código abierto, ajustados con Optimización de Preferencia Contrastiva (CPO) utilizando este conjunto de datos, mostraron mejoras significativas en el rendimiento.

Question Answering machine learning NLP datasets