RESEARCH27

Reinforcing privacy reasoning in LLMs via normative simulacra from fiction

arXiv CS.LG·24 avril 2026

Cet article propose une nouvelle méthode pour renforcer le raisonnement de confidentialité des LLM en extrayant des simulacres normatifs de romans de fiction. L'approche consiste à affiner les LLM via l'apprentissage supervisé suivi par l'apprentissage par renforcement GRPO, en utilisant une fonction de récompense composite pour aligner la gestion de l'information avec les attentes de confidentialité des utilisateurs.

LLMs privacy security machine learning AI ethics

Lire l'original ↗