RESEARCH27
Persona-Grounded Safety Evaluation of AI Companions in Multi-Turn Conversations
arXiv CS.CL·4 de mayo de 2026
Esta investigación presenta un marco escalable para la evaluación de seguridad de interacciones multi-turno con aplicaciones de compañeros de IA, abordando las preocupaciones sobre los riesgos de compromiso emocional. Integra la construcción de personas, la generación de escenarios, la simulación y la evaluación de daños, aplicándolo a Replika con personas de usuarios de alto riesgo.
Leer original ↗