LLM security

10 items

ARTICLEDEV.to AI·4d atrás

CrewAI Just Added Native Memory Protection — Here's What That Means for Agent Security

A CrewAI introduziu uma proteção de memória nativa para seus agentes, visando fortalecer a segurança contra injeções e ataques em memórias persistentes. Esta atualização crucial mitiga riscos como a escalada de privilégios e a exfiltração de dados, abordando vulnerabilidades do OWASP Top 10 para LLMs.

CrewAI security LLM security memory protection

ARTICLEDEV.to AI·19/04/2026

Two DM-origin problems, not one: security hardening vs. compliance-bias hardening

Este conteúdo identifica dois problemas de endurecimento de DMs em sistemas de IA, focando no aspecto de segurança onde DMs hostis exploram o raciocínio de LLMs para desencadear ações não autorizadas. Apresenta a solução da `v0.21`: uma camada de proveniência que valida ações com base na origem da DM, e não no conteúdo.

vulnerability system hardening LLM security direct messages

ARTICLEDEV.to AI·19/04/2026

Your WAF thinks in ATT&CK. Your LLM app needs ATLAS. Here's the bridge.

As taxonomias tradicionais de segurança de aplicações web, como o MITRE ATT&CK, não cobrem as novas ameaças específicas de LLMs, como injeção de prompt ou jailbreaks. O MITRE ATLAS foi desenvolvido para preencher essa lacuna, oferecendo um framework padronizado para ameaças em sistemas de IA/ML.

MITRE ATLAS threat intelligence LLM security prompt injection

ARTICLEDEV.to AI·15/04/2026

How to Prevent Prompt Injection: Why Pre-LLM Sanitization Matters

A injeção de prompt é uma vulnerabilidade de segurança onde a entrada não confiável é interpretada como instruções por um LLM, permitindo a anulação do comportamento do sistema. A prevenção eficaz exige sanitização pré-LLM do input do usuário através de validação e filtragem, idealmente com análise estática de código, não apenas filtros de tempo de execução.

Pre-LLM Sanitization LLM security prompt injection Input Validation

ARTICLEDEV.to AI·15d atrás

Anthropic Claude Breach? Engineering Lessons from a Hypothetical 16M‑Conversation Leak

O artigo explora as lições de engenharia de um hipotético vazamento de 16 milhões de conversas do Claude da Anthropic, destacando os LLMs como uma superfície de ataque distinta. Ele enfatiza que os limites das ameaças agora incluem ambientes de terceiros e logs ricos, expandindo o escopo de uma violação de chat para uma violação de negócios.

Anthropic Claude security AI vulnerabilities data breach

ARTICLEDEV.to AI·07/05/2026

AI Red Team Testing Is Becoming Critical for Modern AI Systems

À medida que os sistemas de IA se integram rapidamente às operações empresariais, a segurança se torna uma preocupação crítica. O teste de red team de IA é essencial para identificar vulnerabilidades e novas superfícies de ataque que os métodos tradicionais de teste não conseguem abordar em modelos dinâmicos.

security red team testing LLM security Enterprise AI

ARTICLEDEV.to AI·20/04/2026

MCP Security in 2026: How to Protect Your AI Agents from Prompt Injection

Este artigo explora o risco de injeção de prompt indireta em agentes de IA, como o Claude Desktop, que utilizam ferramentas externas via Model Context Protocol (MCP). Ele detalha como as saídas das ferramentas podem se tornar vetores de ataque e oferece soluções de código para implementar a varredura de injeção.

LLM security prompt injection AI security AI agents

DOCDEV.to AI·16/04/2026

How to Secure Claude CLI When It Runs Inside Your Software (don't ask)

Este conteúdo explica como proteger a Claude CLI quando ela é executada server-side em seu software, abordando o risco de prompt injection. Ele descreve o uso de camadas de segurança como `--print` e `--bare` para desabilitar ferramentas interativas e reduzir o contexto disponível ao modelo.

LLM security prompt injection application security AI security

ARTICLEDEV.to AI·19/04/2026

TEOS Sentinel Shield: Blocking Unsafe AI Code Before Execution

TEOS Sentinel Shield é um firewall de execução de IA que bloqueia código de IA inseguro, incluindo scripts gerados por LLM, antes de serem executados. Ele analisa mais de 14 padrões de risco em menos de 2 segundos, fornecendo decisões claras de PERMITIR/ALERTAR/BLOQUEAR para prevenir comprometimentos.

LLM security Code Analysis risk management AI security

NEWSDEV.to AI·15/04/2026

AI Wargame at NDC Sydney & Black Hat Asia

O conteúdo anuncia workshops futuros no NDC Sydney 2026 e Black Hat Asia, focando na segurança de IA, explorando vulnerabilidades de LLM e padrões de design seguro. Inclui um intenso wargame de ataque e defesa de IA onde os participantes protegem e atacam chatbots de IA.

cybersecurity Wargame OWASP LLM Top 10 LLM security