heapsort
RESEARCH30

Text-as-Signal: Quantitative Semantic Scoring with Embeddings, Logprobs, and Noise Reduction

arXiv CS.CL·16 de abril de 2026

Este artículo presenta un pipeline práctico para transformar corpora de texto en señales semánticas cuantitativas, utilizando embeddings, evaluación basada en logprobs y reducción de ruido. El estudio de caso aplica seis dimensiones semánticas a noticias portuguesas sobre IA para apoyar tareas de ingeniería de IA como la inspección y el monitoreo de corpus.

Leer original