heapsort
RESEARCH30

AERIC: Anticipatory Hidden-State Monitoring for Implicit Harmful Dialogue

arXiv CS.CL·26 de maio de 2026

Este artigo apresenta AERIC, uma nova abordagem para monitoramento antecipatório de estados ocultos em modelos de linguagem. O objetivo é detectar riscos de diálogo prejudicial implícito precocemente, antes que o conteúdo problemático seja exposto.

Ler original