RESEARCH30
AERIC: Anticipatory Hidden-State Monitoring for Implicit Harmful Dialogue
arXiv CS.CL·26 de maio de 2026
Este artigo apresenta AERIC, uma nova abordagem para monitoramento antecipatório de estados ocultos em modelos de linguagem. O objetivo é detectar riscos de diálogo prejudicial implícito precocemente, antes que o conteúdo problemático seja exposto.
Ler original ↗