Text-as-Signal: Quantitative Semantic Scoring with Embeddings, Logprobs, and Noise Reduction
Cet article présente un pipeline pratique pour transformer des corpus de texte en signaux sémantiques quantitatifs, en utilisant des embeddings, une évaluation basée sur les logprobs et la réduction du bruit. L'étude de cas applique six dimensions sémantiques à des articles de presse portugais sur l'IA, soutenant des tâches d'ingénierie de l'IA telles que l'inspection et le suivi de corpus.