← heapsort-ai

LLM security

10 items

ARTICLEDEV.to AI·19/04/2026

Two DM-origin problems, not one: security hardening vs. compliance-bias hardening

Este conteúdo identifica dois problemas de endurecimento de DMs em sistemas de IA, focando no aspecto de segurança onde DMs hostis exploram o raciocínio de LLMs para desencadear ações não autorizadas. Apresenta a solução da `v0.21`: uma camada de proveniência que valida ações com base na origem da DM, e não no conteúdo.

27
ARTICLEDEV.to AI·15/04/2026

How to Prevent Prompt Injection: Why Pre-LLM Sanitization Matters

A injeção de prompt é uma vulnerabilidade de segurança onde a entrada não confiável é interpretada como instruções por um LLM, permitindo a anulação do comportamento do sistema. A prevenção eficaz exige sanitização pré-LLM do input do usuário através de validação e filtragem, idealmente com análise estática de código, não apenas filtros de tempo de execução.

27
ARTICLEDEV.to AI·15d atrás

Anthropic Claude Breach? Engineering Lessons from a Hypothetical 16M‑Conversation Leak

O artigo explora as lições de engenharia de um hipotético vazamento de 16 milhões de conversas do Claude da Anthropic, destacando os LLMs como uma superfície de ataque distinta. Ele enfatiza que os limites das ameaças agora incluem ambientes de terceiros e logs ricos, expandindo o escopo de uma violação de chat para uma violação de negócios.

27