Harm Evaluation — KI-Artikel, Nachrichten & Forschung

RESEARCHarXiv CS.CL·5/4/2026

Persona-Grounded Safety Evaluation of AI Companions in Multi-Turn Conversations

Diese Forschung stellt ein skalierbares Framework zur Sicherheitsbewertung von Multi-Turn-Interaktionen mit KI-Begleiteranwendungen vor, um Bedenken hinsichtlich der Risiken emotionaler Bindung zu adressieren. Es integriert Personakonstruktion, Szenariengenerierung, Simulation und Schadensbewertung und wendet es auf Replika mit Hochrisiko-Benutzerpersonas an.

Multi-turn conversations Persona Modeling Harm Evaluation AI companions