natural language processing

167 items

ARTICLE↑ trendingHacker News (AI)·hace 9h

AI takes people at their word

Este artículo explora cómo la inteligencia artificial a menudo interpreta las instrucciones humanas de forma literal, sin captar la intención subyacente o el contexto. Esto puede conducir a resultados inesperados o incluso cómicos debido a la falta de comprensión matizada por parte de la IA.

AI limitations AI interpretation natural language processing human-AI interaction

RESEARCHDEV.to AI·hace 10h

Aligning with Human Judgement: The Role of Pairwise Preference in Large LanguageModel Evaluators

Este contenido explora el papel crítico de la preferencia por pares en la evaluación de Grandes Modelos de Lenguaje (LLM). Discute cómo este método puede ayudar a alinear el rendimiento de los LLM de manera más efectiva con el juicio humano.

Human Alignment Pairwise Preference natural language processing AI Research

RESEARCHarXiv CS.CL·hace 1d

Improving Cross-Lingual Factual Recall via Consistency-Driven Reinforcement Learning

Esta investigación presenta PolyFact, un conjunto de datos de preguntas y respuestas factuales multilingüe, para abordar la inconsistencia factual entre idiomas en los LLMs. Se encuentra que el aprendizaje por refuerzo a través de GRPO mejora consistentemente la recuperación factual entre idiomas y la generalización en comparación con el ajuste fino supervisado.

Multilingual AI LLMs reinforcement learning machine learning

RESEARCHarXiv CS.CL·hace 1d

CAF-Gen: A Multi-Agent System for Enriching Argumentation Structures

CAF-Gen es un marco multiagente diseñado para enriquecer estructuras argumentativas superficiales en modelos compatibles con CAF, abordando limitaciones en las técnicas actuales de Minería de Argumentos. Emplea un proceso iterativo de Creador-Revisor para asegurar la integridad estructural y mitigar la inestabilidad.

Argumentation Frameworks Argument Mining natural language processing Computational Linguistics

RESEARCHDEV.to AI·24/4/2026

"Go eat a bat, Chang!": On the Emergence of Sinophobic Behavior on WebCommunities in the Face of COVID-19

Esta investigación explora la emergencia del comportamiento sinofóbico en comunidades web online durante la pandemia de COVID-19. El estudio resalta la aparición de sentimientos antichinos y discurso de odio en espacios digitales.

hate-speech social media natural language processing content moderation

RESEARCHarXiv CS.AI·hace 19h

Automatic Extraction of Structured Information from Brain MRI Reports Using an Open-Weight Large Language Model

Este artículo de investigación explora la extracción automática de datos de informes de resonancia magnética cerebral utilizando el modelo de lenguaje de código abierto LLaMA 3.1. Evalúa el rendimiento del LLM en el análisis de informes de neurorradiología holandeses, mostrando un alto rendimiento zero-shot.

Data Extraction natural language processing Neuroradiology Medical Imaging

RESEARCHarXiv CS.CL·hace 19h

Bidirectional Small-Granularity Search between Code and Text

Esta investigación presenta una nueva tarea de búsqueda bidireccional de granularidad pequeña entre código y texto, con el objetivo de vincular publicaciones científicas con segmentos de código correspondientes. Propone un gran conjunto de datos, parcialmente generado por GPT-4, y un enfoque modular que logra buenos resultados.

machine learning natural language processing Code Analysis Information Retrieval

RESEARCHarXiv CS.CL·hace 19h

Community-Specific Slang and Entity Detection via Semantic Shift in Fine-Tuned Language Models

Este estudio propone un método no supervisado para resolver argot y entidades únicas de comunidades en línea mediante el análisis de la magnitud del cambio semántico. El cambio semántico se define como la evolución de la representación codificada de una palabra tras el ajuste fino de un Gran Modelo de Lenguaje (LLM) preentrenado en un corpus de texto específico de la comunidad.

online-communities semantic-shift natural language processing large language models

RESEARCHarXiv CS.CL·hace 19h

Retrieval Augmented Generation Framework for the Nepali Legal Domain Question Answering

Este estudio presenta la primera aplicación de un modelo de Generación Aumentada por Recuperación (RAG) para la respuesta a preguntas legales en nepalí, abordando la escasez de datos en idiomas de bajos recursos. Utilizando BM25 en documentos fragmentados, el pipeline RAG logró alta precisión y veracidad, demostrando su eficacia en el dominio legal nepalí.

Retrieval Augmented Generation Legal AI Question Answering natural language processing

RESEARCHarXiv CS.CL·hace 19h

Implicit Causal Graph Construction in Text via Chain Discovery

Este artículo investiga la construcción de grafos causales implícitos a partir de texto, infiriendo eventos causales intermedios utilizando Grandes Modelos de Lenguaje (LLMs). Compara la construcción de grafos de extremo a extremo con métodos de descubrimiento de cadenas causales y evalúa la validez de las relaciones causales inferidas frente a una base de datos curada.

text analysis natural language processing graph theory large language models

ARTICLEDEV.to AI·23/4/2026

How I built an AI RAG system to convert PDF to Q&As

Este artículo detalla las cinco etapas de ingeniería para construir un sistema AI RAG llamado LongTermMemory, que convierte PDFs en preguntas y respuestas. Describe la pipeline completa de procesamiento de documentos, desde la extracción y fragmentación de texto hasta el uso de una base de datos vectorial y Generación Aumentada por Recuperación (RAG), con un backend en Laravel y FastAPI.

Vector Databases RAG natural language processing AI

DOC↑ trendingReddit r/LocalLLaMA·21/4/2026

ibm-granite/granite-4.1-8b · Hugging Face

Granite-4.1-8B es un modelo de instrucción de contexto largo de 8 mil millones de parámetros de IBM, mejorado mediante ajuste fino y alineación para capacidades avanzadas de llamada de herramientas, seguimiento de instrucciones y chat. Soporta múltiples idiomas y fue lanzado en abril de 2026 bajo la licencia Apache 2.0.

NLP natural language processing AI model Large Language Model

ibm-granite/granite-4.1-8b · Hugging Face

ARTICLE↑ trendingReddit r/MachineLearning·18/4/2026

easyaligner: Forced alignment with GPU acceleration and flexible text normalization (compatible with all w2v2 models on HF Hub) [P]

easyaligner es una nueva librería de alineación forzada, potente y fácil de usar, que ofrece aceleración por GPU y normalización de texto flexible. Compatible con modelos w2v2 del HF Hub, resuelve problemas comunes en el preprocesamiento de voz a texto, como transcripciones parciales y segmentos de audio largos.

GPU Acceleration machine learning natural language processing Speech-to-Text

easyaligner: Forced alignment with GPU acceleration and flexible text normalization (compatible with all w2v2 models on HF Hub) [P]

RESEARCH↑ trendingReddit r/MachineLearning·24/4/2026

New project about llm hallucination [P]

Este contenido introduce un nuevo proyecto secundario y su repositorio de GitHub, centrado en mitigar la alucinación de LLM mediante un novedoso método de muestreo contrastivo y entrenamiento selectivo. La idea central trata la alucinación como un problema de preferencia, utilizando muestras negativas auto-generadas y un aprendizaje basado en divergencia y con compuertas para promover respuestas correctas y suprimir las incorrectas.

hallucination model training natural language processing AI safety

ARTICLEDEV.to AI·23/4/2026

Advanced Triage: Using AI to Automate Design Feedback Sorting

Este artículo describe cómo la IA puede automatizar la clasificación y priorización de comentarios de diseño de clientes. Mediante el análisis en capas, la IA detecta la urgencia y clasifica las solicitudes, transformando texto vago en datos procesables y estructurados para mayor eficiencia.

design natural language processing feedback management AI

RESEARCH↑ trendingReddit r/LocalLLaMA·10/4/2026

National University of Singapore Presents "DMax": A New Paradigm For Diffusion Language Models (dLLMs) Enabling Aggressive Parallel Decoding.

DMax é um novo paradigma para modelos de linguagem de difusão (dLLMs) eficientes que mitiga o acúmulo de erros na decodificação paralela. Ele permite um paralelismo agressivo ao reformular a decodificação como um processo de auto-refinamento progressivo e introduzir uma estratégia de treinamento unificada.

Diffusion Models Parallel Decoding natural language processing AI

ARTICLE↑ trendingReddit r/MachineLearning·22/4/2026

I can't believe text normalization is so underdiscussed in streaming text-to-speech [D]

El autor señala la poca discusión sobre la normalización de texto en modelos de TTS en streaming, donde fallan al pronunciar fechas, URLs y otros elementos básicos. Menciona un benchmark que compara modelos comerciales de TTS centrándose en estos desafíos específicos.

AI models natural language processing Benchmarks Text-to-Speech

ARTICLE↑ trendingReddit r/LocalLLaMA·hace 19d

Qwen3.6 35Ba3 has changed my workflows and even how I use my computer

El autor detalla cómo el modelo de IA Qwen3.6 35Ba3 ha transformado profundamente sus flujos de trabajo de desarrollo y el uso de su computadora, permitiéndole automatizar tareas complejas e interactuar con el sistema operativo mediante lenguaje natural. Esta transformación le permite delegar tareas como devops, creación de contenido y pruebas de código a la IA, destacando un cambio significativo en la productividad.

Qwen3.6 natural language processing AI workflow automation

RESEARCHarXiv CS.CL·hace 1d

HKJudge: A Legal Discourse-Annotated Corpus for Interpreting What Courts Find, How They Reason, and What They Rule

El proyecto HKJudge introduce el primer corpus de discurso legal anotado por expertos a nivel de oración de sentencias penales de Hong Kong, que comprende aproximadamente 290 mil oraciones. Utiliza un esquema de discurso de dos niveles para identificar lo que los tribunales encuentran, cómo razonan y lo que dictaminan, con un alto acuerdo entre anotadores.

natural language processing datasets linguistics legal tech

RESEARCHarXiv CS.CL·21/4/2026

Foundational Study on Authorship Attribution of Japanese Web Reviews for Actor Analysis

Este estudio fundamental investiga la atribución de autoría basada en características estilísticas para el análisis de actores en inteligencia de amenazas, utilizando datos de reseñas web japonesas. Aunque el ajuste fino de BERT logró el mejor rendimiento, TF-IDF con regresión logística demostró una estabilidad y precisión superiores al escalar a cientos de autores.

authorship attribution security machine learning natural language processing