← heapsort-ai

BERT

5 items

RESEARCHarXiv CS.CL·04/05/2026

NorBERTo: A ModernBERT Model Trained for Portuguese with 331 Billion Tokens Corpus

NorBERTo é um novo modelo ModernBERT treinado com um corpus de 331 bilhões de tokens em português brasileiro (Aurora-PT), projetado para suporte a contexto longo e mecanismos de atenção eficientes. Ele alcança os melhores resultados entre os modelos codificadores avaliados em tarefas de similaridade semântica, inferência textual e classificação usando datasets como ASSIN 2 e PLUE.

28
RESEARCHarXiv CS.CL·13/04/2026

A Representation-Level Assessment of Bias Mitigation in Foundation Models

Esta pesquisa investiga como a mitigação de viés remodela o espaço de incorporação de modelos de fundação, como BERT e Llama2. Os resultados indicam que a mitigação de viés reduz as disparidades de gênero-ocupação no espaço de incorporação, levando a representações internas mais neutras, o que posiciona a análise de incorporação como uma ferramenta valiosa para validar métodos de desenviesamento.

27
DOCDEV.to AI·20d atrás

92. BERT: The Model That Reads in Both Directions

BERT se diferencia do GPT por sua capacidade de leitura bidirecional, prevendo palavras mascaradas em vez de sequências. Essa compreensão contextual completa o tornou dominante em benchmarks de PNL e um pilar para tarefas de entendimento. O conteúdo detalha os mecanismos de pré-treinamento e as técnicas de ajuste fino do BERT.

27