RESEARCHarXiv CS.CL·04/05/2026
Persona-Grounded Safety Evaluation of AI Companions in Multi-Turn Conversations
Esta pesquisa apresenta uma estrutura escalável para avaliação de segurança de interações multi-turn com aplicativos de companheiros de IA, abordando preocupações sobre os riscos de engajamento emocional. O framework integra construção de persona, geração de cenário, simulação e avaliação de danos, aplicando-o ao Replika com personas de usuários de alto risco.
27