RESEARCH28
CR4T: Rewrite-Based Guardrails for Adolescent LLM Safety
arXiv CS.CL·22 de maio de 2026
Modelos de linguagem grandes (LLMs) estão cada vez mais presentes em ambientes digitais para adolescentes, mas os mecanismos de segurança atuais são focados em adultos e baseados em recusa, o que pode limitar a orientação. Este artigo propõe o CR4T, um framework agnóstico de modelo que reformula saídas inseguras em respostas apropriadas para a idade e orientadas para o aconselhamento, abordando a segurança de LLMs para adolescentes como um problema de transformação socio-técnica.
Ler original ↗