RESEARCH27
Reinforcing privacy reasoning in LLMs via normative simulacra from fiction
arXiv CS.LG·24 avril 2026
Cet article propose une nouvelle méthode pour renforcer le raisonnement de confidentialité des LLM en extrayant des simulacres normatifs de romans de fiction. L'approche consiste à affiner les LLM via l'apprentissage supervisé suivi par l'apprentissage par renforcement GRPO, en utilisant une fonction de récompense composite pour aligner la gestion de l'information avec les attentes de confidentialité des utilisateurs.
Lire l'original ↗