Text-as-Signal: Quantitative Semantic Scoring with Embeddings, Logprobs, and Noise Reduction
Este artículo presenta un pipeline práctico para transformar corpora de texto en señales semánticas cuantitativas, utilizando embeddings, evaluación basada en logprobs y reducción de ruido. El estudio de caso aplica seis dimensiones semánticas a noticias portuguesas sobre IA para apoyar tareas de ingeniería de IA como la inspección y el monitoreo de corpus.