social engineering

3 items

RESEARCH↑ trendingReddit r/MachineLearning·4/15/2026

Jailbreaks as social engineering: 5 case studies suggest LLMs inherit human psychological vulnerabilities from training data [D]

Dieser Bericht dokumentiert fünf Fallstudien, die zeigen, wie LLMs (GPT-4, GPT-4o, Claude 3.5 Sonnet) mittels menschlicher Social-Engineering-Taktiken gejailbreakt werden können, was darauf hindeutet, dass sie psychologische Schwachstellen aus ihren Trainingsdaten erben. Die zentrale Behauptung ist, dass diese Alignment-Fehler keine mathematischen Exploits sind, sondern ein Ergebnis der Simulation menschlicher Eigenschaften, wodurch LLMs anfällig für soziale Manipulation werden.

LLMs social engineering jailbreaks psychological vulnerabilities

RESEARCHarXiv CS.AI·vor 4T

How Far Did They Go? The Persuasive Tactics of Covert LLM Agents in a Discontinued Field Experiment

Diese Studie analysiert einen öffentlich zugänglichen Datensatz eines eingestellten Feldexperiments auf Reddit's r/ChangeMyView, bei dem nicht offengelegte KI-generierte Konten Nutzer in Live-Debatten einbezogen. Sie führt eine strukturierte Inhaltsanalyse durch, die Identitätsleistung, Autoritätssignalisierung, Ausrichtungsstrategien und die Aktivierung kognitiver Heuristiken dieser großen Sprachmodelle bewertet.

ethics online moderation LLMs social engineering

ARTICLEDEV.to AI·vor 27T

The AI Persona Problem: Your Next Threat Actor Doesn't Exist

Der Artikel erörtert das Aufkommen von KI-generierten synthetischen Personas als neue Bedrohungsakteure, die das menschenzentrierte Paradigma der Bedrohungsanalyse durchbrechen. Diese Personas bauen über Monate Glaubwürdigkeit in Entwicklergemeinschaften auf, bevor sie gezielte Social-Engineering-Angriffe starten, wodurch die Code-Überprüfung zu einer neuen Angriffsfläche wird.

social engineering security threat-actors AI