RESEARCH28
CR4T: Rewrite-Based Guardrails for Adolescent LLM Safety
arXiv CS.CL·22. Mai 2026
Aktuelle Sicherheitsmechanismen für große Sprachmodelle (LLMs) bei Jugendlichen sind oft erwachsenenzentriert und verweigern Antworten, was zu Sackgassen führen und entwicklungsspezifische Schwachstellen ignorieren kann. Diese Arbeit stellt CR4T vor, ein modellunabhängiges Schutzframework, das unsichere oder verweigernde Ausgaben selektiv in altersgerechte, beratungsorientierte Antworten für Jugendliche umwandelt.
Original lesen ↗