← heapsort-ai

semantic analysis

5 items

RESEARCHarXiv CS.CL·16/04/2026

Text-as-Signal: Quantitative Semantic Scoring with Embeddings, Logprobs, and Noise Reduction

Este artigo apresenta um pipeline prático para transformar corpora de texto em sinais semânticos quantitativos, utilizando embeddings, avaliação baseada em logprobs e redução de ruído. O estudo de caso aplica seis dimensões semânticas a notícias portuguesas sobre IA para suportar tarefas de engenharia de IA como inspeção e monitoramento de corpus.

30
RESEARCHarXiv CS.CL·18d atrás

Sem-Detect: Semantic Level Detection of AI Generated Peer-Reviews

Sem-Detect é um método inovador para distinguir revisões por pares escritas por humanos de revisões geradas por IA, combinando características textuais com análise semântica em nível de reivindicação. Ele explora a observação de que modelos de IA tendem a convergir para pontos semelhantes, enquanto revisores humanos introduzem ideias mais únicas, permitindo a detecção de revisões totalmente de IA e aquelas refinadas por LLMs mas com julgamento humano.

28
RESEARCHarXiv CS.CL·10/04/2026

Reasoning-Based Refinement of Unsupervised Text Clusters with LLMs

Este artigo propõe uma estrutura de refinamento baseada em raciocínio que utiliza LLMs como juízes semânticos para validar e reestruturar os resultados de algoritmos de agrupamento de texto não supervisionados. A estrutura inclui verificação de coerência, adjudicação de redundância e fundamentação de rótulos, visando melhorar a qualidade dos clusters sem dados rotulados.

28
RESEARCHarXiv CS.CL·6d atrás

On the Persistent Effects of Lexicality in Large Language Mod

Este trabalho investiga o efeito da sobreposição lexical nas representações de grandes modelos de linguagem (LLMs), em vez do conteúdo semântico, e suas implicações. Os autores descobrem que a influência lexical persiste em diferentes profundidades, arquiteturas e regimes de treinamento dos modelos, mesmo naqueles treinados para similaridade semântica.

27
RESEARCHarXiv CS.CL·15/04/2026

Leveraging Weighted Syntactic and Semantic Context Assessment Summary (wSSAS) Towards Text Categorization Using LLMs

Este artigo apresenta o Weighted Syntactic and Semantic Context Assessment Summary (wSSAS), um framework determinístico para otimizar a categorização de texto usando LLMs. Ele visa superar a natureza estocástica dos LLMs, organizando o texto hierarquicamente e usando uma relação sinal-ruído (SNR) para focar em características semânticas de alto valor.

27