← heapsort-ai

NLP

124 items

RESEARCHarXiv CS.AI·15/4/2026

GoodPoint: Learning Constructive Scientific Paper Feedback from Author Responses

Esta investigación presenta GoodPoint, un método que utiliza LLMs y respuestas de autores para generar retroalimentación constructiva para artículos científicos. Desarrolla GoodPoint-ICLR, un conjunto de datos de artículos ICLR, y una receta de entrenamiento que emplea fine-tuning y optimización de preferencias para una retroalimentación válida y accionable.

27
RESEARCHarXiv CS.CL·hace 29d

TajPersLexon: A Tajik-Persian Lexical Resource and Hybrid Model for Cross-Script Low-Resource NLP

Este trabajo introduce TajPersLexon, un recurso léxico paralelo tayiko-persa con 40.112 pares de palabras para PNL interescritura en entornos de bajos recursos. Evalúa modelos híbridos, neuronales y de recuperación, demostrando una alta precisión para las bases neuronales y de recuperación (98-99%) y un equilibrio favorable entre precisión y eficiencia para el modelo híbrido (96,4%) en la post-corrección de OCR.

27
RESEARCHarXiv CS.CL·hace 22d

Why are language models less surprised than humans? Testing the Parse Multiplicity Mismatch Hypothesis

Este artículo investiga por qué los modelos de lenguaje muestran menos "sorpresa" que los humanos al procesar oraciones sintácticamente ambiguas. Prueba la hipótesis de que los LMs pueden considerar simultáneamente un mayor número de interpretaciones de oraciones utilizando Gramáticas de Red Neuronal Recurrente.

27
RESEARCHarXiv CS.CL·7/5/2026

The Impact of Vocabulary Overlaps on Knowledge Transfer in Multilingual Machine Translation

Este artículo investiga sistemáticamente el impacto de vocabularios conjuntos y disjuntos en la transferencia de conocimiento en la traducción automática neuronal multilingüe (MNMT). Los experimentos muestran que las amplias superposiciones de vocabulario, la relación lingüística y la coincidencia de dominio conducen a un mejor rendimiento, incluso en configuraciones fuera de dominio.

27
RESEARCHarXiv CS.CL·hace 26d

Differences in Text Generated by Diffusion and Autoregressive Language Models

Esta investigación examina las diferencias inherentes en el texto generado por Modelos de Lenguaje de Difusión (DLM) y Modelos de Lenguaje Autorregresivos (ARM), encontrando que los DLM muestran menor entropía n-grama, pero mayor coherencia y diversidad semántica. Experimentos controlados indican que los objetivos de entrenamiento de los DLM contribuyen a la coherencia y diversidad semántica, mientras que los algoritmos de decodificación son responsables de la reducción de la entropía.

27
RESEARCHarXiv CS.CL·hace 6d

On the Persistent Effects of Lexicality in Large Language Mod

Este trabajo investiga el efecto persistente de la superposición léxica, en lugar del contenido semántico, en las representaciones extraídas de grandes modelos de lenguaje (LLMs) y sus implicaciones. Los autores encuentran que la influencia léxica se extiende a través de la profundidad de los modelos, arquitecturas y regímenes de entrenamiento, incluso en modelos entrenados para similitud semántica.

27
RESEARCHarXiv CS.CL·hace 13d

CroCo: Cross-Lingual Contrastive Preference Tuning on Self-Generations

Este trabajo presenta CroCo, un método de ajuste de preferencias contrastivas interlingües en autogeneraciones de LLMs, que demuestra una transferencia efectiva entre 14 idiomas sin anotaciones de preferencia específicas. Un modelo de recompensa entrenado en inglés produce clasificaciones útiles en la mayoría de los idiomas, mejorando los modelos existentes y previniendo el olvido catastrófico, siempre que se utilicen datos on-policy.

27
DOCDEV.to AI·hace 16d

RAG 시스템 실전 구축 (v18)

Este documento detalla la implementación práctica de sistemas RAG (Retrieval-Augmented Generation), explicando sus conceptos fundamentales y el ciclo operativo. Cubre las etapas de recuperación, aumento y generación de contexto para mejorar las respuestas de los LLM, incluyendo la fragmentación semántica de documentos.

27
ARTICLEDEV.to AI·hace 8d

AI debt sales reshape global corporate bond markets

La integración de la IA en la venta de deuda está preparada para alterar significativamente los mercados globales de bonos corporativos, impulsada por la capacidad de los sistemas de IA para analizar grandes volúmenes de datos y hacer predicciones precisas. Las plataformas de venta de deuda con IA utilizan algoritmos de aprendizaje automático y procesamiento de lenguaje natural para evaluar la solvencia e identificar riesgos y oportunidades.

27
ARTICLEDEV.to AI·27/4/2026

Epismo Agent Package

El Análisis Técnico del Paquete de Agentes Epismo detalla una solución innovadora para crear humanos digitales impulsados por IA, destinados a servicio al cliente, entretenimiento y educación. Su arquitectura de microservicios integra procesamiento de lenguaje natural, aprendizaje automático y visión por computadora, gestionados por un Núcleo de Agente y un Grafo de Conocimiento.

27
DOCDEV.to AI·hace 20d

92. BERT: The Model That Reads in Both Directions

BERT se diferencia de GPT por su capacidad de lectura bidireccional, prediciendo palabras enmascaradas en lugar de secuenciales. Esta comprensión contextual completa lo convirtió en dominante en los benchmarks de PNL y una piedra angular para las tareas de comprensión. El contenido detalla los mecanismos de preentrenamiento y las técnicas de ajuste fino de BERT.

27
ARTICLEDEV.to AI·hace 26d

NLP Video Editing Copilot

Cutting Room AI es una aplicación de escritorio independiente para Windows que permite a los usuarios de DaVinci Resolve Studio controlar su línea de tiempo con lenguaje natural. Traduce comandos en inglés sencillo a llamadas de API de scripting, permitiendo a los usuarios modificar propiedades de clips y realizar operaciones de pista sin necesidad de conocimientos de scripting.

27
DOCDEV.to AI·hace 26d

Spellar 3.0

Spellar 3.0 es una plataforma de aprendizaje de idiomas impulsada por IA que ofrece instrucción y retroalimentación personalizadas. Su arquitectura técnica incluye un frontend React, un backend Node.js con PostgreSQL y un motor de PNL capaz de analizar la entrada de usuario en varios idiomas.

27