RESEARCH27

Persona-Grounded Safety Evaluation of AI Companions in Multi-Turn Conversations

arXiv CS.CL·4 mai 2026

Cette recherche introduit un cadre évolutif pour l'évaluation de la sécurité des interactions multi-tours avec les applications de compagnons IA, répondant aux préoccupations concernant les risques d'engagement émotionnel. Il intègre la construction de persona, la génération de scénarios, la simulation et l'évaluation des dommages, l'appliquant à Replika avec des personas d'utilisateurs à haut risque.

Multi-turn conversations Persona Modeling Harm Evaluation AI companions AI safety

Lire l'original ↗