RESEARCH30

Predict and Reconstruct: Joint Objectives for Self-Supervised Language Representation Learning

arXiv CS.CL·5 juin 2026

Cet article propose un objectif de pré-entraînement hybride pour les encodeurs de texte, combinant une perte de prédiction d'espace latent de type JEPA avec un objectif standard de modélisation de langage masqué (MLM). Cette approche vise à encourager des représentations ancrées dans une structure sémantique plus profonde plutôt que dans la simple identité des tokens de surface, démontrant des embeddings significativement plus uniformes.

language models deep learning self-supervised learning machine learning Natural Language Processing

Lire l'original ↗