heapsort
RESEARCH28

CR4T: Rewrite-Based Guardrails for Adolescent LLM Safety

arXiv CS.CL·22 de maio de 2026

Modelos de linguagem grandes (LLMs) estão cada vez mais presentes em ambientes digitais para adolescentes, mas os mecanismos de segurança atuais são focados em adultos e baseados em recusa, o que pode limitar a orientação. Este artigo propõe o CR4T, um framework agnóstico de modelo que reformula saídas inseguras em respostas apropriadas para a idade e orientadas para o aconselhamento, abordando a segurança de LLMs para adolescentes como um problema de transformação socio-técnica.

Ler original