← heapsort-ai

natural language processing

167 items

RESEARCHarXiv CS.CL·hace 1d

Improving Cross-Lingual Factual Recall via Consistency-Driven Reinforcement Learning

Esta investigación presenta PolyFact, un conjunto de datos de preguntas y respuestas factuales multilingüe, para abordar la inconsistencia factual entre idiomas en los LLMs. Se encuentra que el aprendizaje por refuerzo a través de GRPO mejora consistentemente la recuperación factual entre idiomas y la generalización en comparación con el ajuste fino supervisado.

60
RESEARCHarXiv CS.CL·hace 1d

CAF-Gen: A Multi-Agent System for Enriching Argumentation Structures

CAF-Gen es un marco multiagente diseñado para enriquecer estructuras argumentativas superficiales en modelos compatibles con CAF, abordando limitaciones en las técnicas actuales de Minería de Argumentos. Emplea un proceso iterativo de Creador-Revisor para asegurar la integridad estructural y mitigar la inestabilidad.

60
RESEARCHarXiv CS.AI·hace 19h

Automatic Extraction of Structured Information from Brain MRI Reports Using an Open-Weight Large Language Model

Este artículo de investigación explora la extracción automática de datos de informes de resonancia magnética cerebral utilizando el modelo de lenguaje de código abierto LLaMA 3.1. Evalúa el rendimiento del LLM en el análisis de informes de neurorradiología holandeses, mostrando un alto rendimiento zero-shot.

54
RESEARCHarXiv CS.CL·hace 19h

Bidirectional Small-Granularity Search between Code and Text

Esta investigación presenta una nueva tarea de búsqueda bidireccional de granularidad pequeña entre código y texto, con el objetivo de vincular publicaciones científicas con segmentos de código correspondientes. Propone un gran conjunto de datos, parcialmente generado por GPT-4, y un enfoque modular que logra buenos resultados.

54
RESEARCHarXiv CS.CL·hace 19h

Community-Specific Slang and Entity Detection via Semantic Shift in Fine-Tuned Language Models

Este estudio propone un método no supervisado para resolver argot y entidades únicas de comunidades en línea mediante el análisis de la magnitud del cambio semántico. El cambio semántico se define como la evolución de la representación codificada de una palabra tras el ajuste fino de un Gran Modelo de Lenguaje (LLM) preentrenado en un corpus de texto específico de la comunidad.

54
RESEARCHarXiv CS.CL·hace 19h

Retrieval Augmented Generation Framework for the Nepali Legal Domain Question Answering

Este estudio presenta la primera aplicación de un modelo de Generación Aumentada por Recuperación (RAG) para la respuesta a preguntas legales en nepalí, abordando la escasez de datos en idiomas de bajos recursos. Utilizando BM25 en documentos fragmentados, el pipeline RAG logró alta precisión y veracidad, demostrando su eficacia en el dominio legal nepalí.

54
RESEARCHarXiv CS.CL·hace 19h

Implicit Causal Graph Construction in Text via Chain Discovery

Este artículo investiga la construcción de grafos causales implícitos a partir de texto, infiriendo eventos causales intermedios utilizando Grandes Modelos de Lenguaje (LLMs). Compara la construcción de grafos de extremo a extremo con métodos de descubrimiento de cadenas causales y evalúa la validez de las relaciones causales inferidas frente a una base de datos curada.

54
ARTICLEDEV.to AI·23/4/2026

How I built an AI RAG system to convert PDF to Q&As

Este artículo detalla las cinco etapas de ingeniería para construir un sistema AI RAG llamado LongTermMemory, que convierte PDFs en preguntas y respuestas. Describe la pipeline completa de procesamiento de documentos, desde la extracción y fragmentación de texto hasta el uso de una base de datos vectorial y Generación Aumentada por Recuperación (RAG), con un backend en Laravel y FastAPI.

49
ARTICLE↑ trendingReddit r/MachineLearning·18/4/2026

easyaligner: Forced alignment with GPU acceleration and flexible text normalization (compatible with all w2v2 models on HF Hub) [P]

easyaligner es una nueva librería de alineación forzada, potente y fácil de usar, que ofrece aceleración por GPU y normalización de texto flexible. Compatible con modelos w2v2 del HF Hub, resuelve problemas comunes en el preprocesamiento de voz a texto, como transcripciones parciales y segmentos de audio largos.

easyaligner: Forced alignment with GPU acceleration and flexible text normalization (compatible with all w2v2 models on HF Hub) [P]
46
RESEARCH↑ trendingReddit r/MachineLearning·24/4/2026

New project about llm hallucination [P]

Este contenido introduce un nuevo proyecto secundario y su repositorio de GitHub, centrado en mitigar la alucinación de LLM mediante un novedoso método de muestreo contrastivo y entrenamiento selectivo. La idea central trata la alucinación como un problema de preferencia, utilizando muestras negativas auto-generadas y un aprendizaje basado en divergencia y con compuertas para promover respuestas correctas y suprimir las incorrectas.

New project about llm hallucination [P]
45
RESEARCH↑ trendingReddit r/LocalLLaMA·10/4/2026

National University of Singapore Presents "DMax": A New Paradigm For Diffusion Language Models (dLLMs) Enabling Aggressive Parallel Decoding.

DMax é um novo paradigma para modelos de linguagem de difusão (dLLMs) eficientes que mitiga o acúmulo de erros na decodificação paralela. Ele permite um paralelismo agressivo ao reformular a decodificação como um processo de auto-refinamento progressivo e introduzir uma estratégia de treinamento unificada.

44
ARTICLE↑ trendingReddit r/LocalLLaMA·hace 19d

Qwen3.6 35Ba3 has changed my workflows and even how I use my computer

El autor detalla cómo el modelo de IA Qwen3.6 35Ba3 ha transformado profundamente sus flujos de trabajo de desarrollo y el uso de su computadora, permitiéndole automatizar tareas complejas e interactuar con el sistema operativo mediante lenguaje natural. Esta transformación le permite delegar tareas como devops, creación de contenido y pruebas de código a la IA, destacando un cambio significativo en la productividad.

42
RESEARCHarXiv CS.CL·hace 1d

HKJudge: A Legal Discourse-Annotated Corpus for Interpreting What Courts Find, How They Reason, and What They Rule

El proyecto HKJudge introduce el primer corpus de discurso legal anotado por expertos a nivel de oración de sentencias penales de Hong Kong, que comprende aproximadamente 290 mil oraciones. Utiliza un esquema de discurso de dos niveles para identificar lo que los tribunales encuentran, cómo razonan y lo que dictaminan, con un alto acuerdo entre anotadores.

40
RESEARCHarXiv CS.CL·21/4/2026

Foundational Study on Authorship Attribution of Japanese Web Reviews for Actor Analysis

Este estudio fundamental investiga la atribución de autoría basada en características estilísticas para el análisis de actores en inteligencia de amenazas, utilizando datos de reseñas web japonesas. Aunque el ajuste fino de BERT logró el mejor rendimiento, TF-IDF con regresión logística demostró una estabilidad y precisión superiores al escalar a cientos de autores.

36