semantic analysis

5 items

RESEARCHarXiv CS.CL·16/4/2026

Text-as-Signal: Quantitative Semantic Scoring with Embeddings, Logprobs, and Noise Reduction

Este artículo presenta un pipeline práctico para transformar corpora de texto en señales semánticas cuantitativas, utilizando embeddings, evaluación basada en logprobs y reducción de ruido. El estudio de caso aplica seis dimensiones semánticas a noticias portuguesas sobre IA para apoyar tareas de ingeniería de IA como la inspección y el monitoreo de corpus.

machine learning NLP embeddings semantic analysis

RESEARCHarXiv CS.CL·hace 18d

Sem-Detect: Semantic Level Detection of AI Generated Peer-Reviews

Sem-Detect es un nuevo método para distinguir entre revisiones por pares escritas por humanos y las generadas por IA, combinando características textuales con análisis semántico a nivel de afirmación. Aprovecha la observación de que los modelos de IA tienden a convergir en puntos similares, mientras que los revisores humanos introducen ideas más únicas, permitiendo la detección de revisiones completamente de IA y aquellas refinadas por LLMs.

Research methodology AI detection semantic analysis Peer review

RESEARCHarXiv CS.CL·10/4/2026

Reasoning-Based Refinement of Unsupervised Text Clusters with LLMs

Este artigo propõe uma estrutura de refinamento baseada em raciocínio que utiliza LLMs como juízes semânticos para validar e reestruturar os resultados de algoritmos de agrupamento de texto não supervisionados. A estrutura inclui verificação de coerência, adjudicação de redundância e fundamentação de rótulos, visando melhorar a qualidade dos clusters sem dados rotulados.

LLMs Text Clustering Reasoning semantic analysis

RESEARCHarXiv CS.CL·15/4/2026

Leveraging Weighted Syntactic and Semantic Context Assessment Summary (wSSAS) Towards Text Categorization Using LLMs

Este artículo presenta el Weighted Syntactic and Semantic Context Assessment Summary (wSSAS), un marco determinista para optimizar la categorización de texto con LLMs. Aborda las limitaciones de los LLMs organizando el texto jerárquicamente y utilizando una relación señal-ruido (SNR) para priorizar características semánticas de alto valor.

LLMs data integrity Text Categorization Natural Language Processing

RESEARCHarXiv CS.CL·hace 6d

On the Persistent Effects of Lexicality in Large Language Mod

Este trabajo investiga el efecto persistente de la superposición léxica, en lugar del contenido semántico, en las representaciones extraídas de grandes modelos de lenguaje (LLMs) y sus implicaciones. Los autores encuentran que la influencia léxica se extiende a través de la profundidad de los modelos, arquitecturas y regímenes de entrenamiento, incluso en modelos entrenados para similitud semántica.

LLMs lexicality NLP semantic analysis