RESEARCH27

Reinforcing privacy reasoning in LLMs via normative simulacra from fiction

arXiv CS.LG·24. April 2026

Dieses Papier schlägt eine neuartige Methode zur Verbesserung des Datenschutz-Reasonings in LLMs vor, indem normative Simulakren aus fiktiven Romanen extrahiert werden. Der Ansatz beinhaltet das Fine-Tuning von LLMs durch überwachtes Lernen gefolgt von GRPO-Reinforcement-Learning, wobei eine zusammengesetzte Belohnungsfunktion verwendet wird, um die Informationshandhabung an die Datenschutz-Erwartungen der Nutzer anzupassen.

LLMs privacy security Machine Learning AI ethics

Original lesen ↗