RESEARCH27

Persona-Grounded Safety Evaluation of AI Companions in Multi-Turn Conversations

arXiv CS.CL·4 de mayo de 2026

Esta investigación presenta un marco escalable para la evaluación de seguridad de interacciones multi-turno con aplicaciones de compañeros de IA, abordando las preocupaciones sobre los riesgos de compromiso emocional. Integra la construcción de personas, la generación de escenarios, la simulación y la evaluación de daños, aplicándolo a Replika con personas de usuarios de alto riesgo.

Multi-turn conversations Persona Modeling Harm Evaluation AI companions AI safety

Leer original ↗