heapsort
RESEARCH30

AERIC: Anticipatory Hidden-State Monitoring for Implicit Harmful Dialogue

arXiv CS.CL·26 mai 2026

Cet article présente AERIC, une nouvelle approche basée sur les états cachés pour le suivi anticipatif et en un seul passage des dialogues nuisibles implicites dans les modèles de langage. Il vise à détecter les risques potentiels suffisamment tôt pour éviter l'exposition de continuations préjudiciables.

Lire l'original