Exploitation

2 items

RESEARCHarXiv CS.CL·4/13/2026

Re-Mask and Redirect: Exploiting Denoising Irreversibility in Diffusion Language Models

Diese Arbeit enthüllt eine kritische Schwachstelle in diffusionsbasierten Sprachmodellen (dLLMs), deren Sicherheitsausrichtung, basierend auf monotonen Entrauschungsplänen, leicht umgangen werden kann. Durch das Neumaskieren von Ablehnungs-Tokens und das Injizieren eines bejahenden Präfixes erzielten Forscher hohe Angriffserfolgsraten gegen prominente dLLMs und legten damit einen strukturellen Fehler offen.

Diffusion Models language models vulnerability Exploitation

DOCDEV.to AI·4/17/2026

Explaining Prompt Injection & Image Injection & How to counter them

Dieser Inhalt erklärt, was Prompt- und Image-Injection sind, und identifiziert sie als bösartige KI-Ausnutzungen. Er beschreibt verschiedene Gegenmaßnahmen, wie die Behandlung von Benutzereingaben als feindselig und den Einsatz von Modellen zur Erkennung böswilliger Absichten in Bildinhalten.

Image Injection Exploitation prompt injection Mitigation