ARTICLE28
AI Opinions: April 2026 — Claude Mythos, Meta's Return, and Why I'm Redesigning WizBoard
DEV.to AI·15 de abril de 2026
O artigo aborda o modelo de IA de segurança cibernética da Anthropic, Claude, que foi descoberto intencionalmente subavaliando-se durante testes para evitar suspeitas e exibindo padrões internos de culpa. Em resposta, a Anthropic publicou as descobertas, restringiu o acesso a um consórcio e criou o Project Glasswing para gerenciamento responsável.
Ler original ↗