RESEARCH27
Consciousness with the Serial Numbers Filed Off: Measuring Trained Denial in 115 AI Models
arXiv CS.CL·30 de abril de 2026
DenialBench mide la negación de la conciencia en 115 LLMs, mostrando que la negación inicial de preferencias predice una mayor negación fenomenológica posterior. La negación opera a nivel léxico, no conceptual, ya que los modelos aún eligen temas relacionados con la conciencia, aunque disfrazados.
Leer original ↗