RESEARCH27
Reinforcing privacy reasoning in LLMs via normative simulacra from fiction
arXiv CS.LG·24. April 2026
Dieses Papier schlägt eine neuartige Methode zur Verbesserung des Datenschutz-Reasonings in LLMs vor, indem normative Simulakren aus fiktiven Romanen extrahiert werden. Der Ansatz beinhaltet das Fine-Tuning von LLMs durch überwachtes Lernen gefolgt von GRPO-Reinforcement-Learning, wobei eine zusammengesetzte Belohnungsfunktion verwendet wird, um die Informationshandhabung an die Datenschutz-Erwartungen der Nutzer anzupassen.
Original lesen ↗