RESEARCH28

CR4T: Rewrite-Based Guardrails for Adolescent LLM Safety

arXiv CS.CL·22. Mai 2026

Aktuelle Sicherheitsmechanismen für große Sprachmodelle (LLMs) bei Jugendlichen sind oft erwachsenenzentriert und verweigern Antworten, was zu Sackgassen führen und entwicklungsspezifische Schwachstellen ignorieren kann. Diese Arbeit stellt CR4T vor, ein modellunabhängiges Schutzframework, das unsichere oder verweigernde Ausgaben selektiv in altersgerechte, beratungsorientierte Antworten für Jugendliche umwandelt.

guardrails adolescent development AI safety LLM

Original lesen ↗