RESEARCH27

Persona-Grounded Safety Evaluation of AI Companions in Multi-Turn Conversations

arXiv CS.CL·4 de maio de 2026

Esta pesquisa apresenta uma estrutura escalável para avaliação de segurança de interações multi-turn com aplicativos de companheiros de IA, abordando preocupações sobre os riscos de engajamento emocional. O framework integra construção de persona, geração de cenário, simulação e avaliação de danos, aplicando-o ao Replika com personas de usuários de alto risco.

Multi-turn conversations Persona Modeling Harm Evaluation AI companions AI safety

Ler original ↗