RESEARCH46
Community-Specific Slang and Entity Detection via Semantic Shift in Fine-Tuned Language Models
arXiv CS.CL·9 juin 2026
Cette étude propose une méthode non supervisée pour identifier l'argot et les entités uniques des communautés en ligne en analysant l'ampleur du glissement sémantique. Le glissement sémantique est défini comme l'évolution de la représentation codée d'un mot après l'ajustement fin d'un Grand Modèle de Langage (LLM) pré-entraîné sur un corpus de texte spécifique à une communauté.
Lire l'original ↗