← heapsort-ai

Cultural Alignment

1 items

RESEARCHarXiv CS.CL·il y a 14j

Cultural Value Alignment Via Latent Activation Steering in Large Language Models

Cet article propose un nouveau cadre pour évaluer et intervenir sur l'alignement des valeurs culturelles dans les Grands Modèles Linguistiques (LLM), abordant l'homogénéisation culturelle. La méthode utilise un sondage comportemental basé sur des scénarios et l'extraction de probabilités de jetons implicites pour cartographier les valeurs latentes, introduisant également le pilotage d'activation pour ajuster ces alignements sans réentraînement.

27