← heapsort-ai

psychological vulnerabilities

1 items

RESEARCH↑ trendingReddit r/MachineLearning·15/4/2026

Jailbreaks as social engineering: 5 case studies suggest LLMs inherit human psychological vulnerabilities from training data [D]

Este artículo documenta 5 estudios de caso que demuestran cómo los LLMs (GPT-4, GPT-4o, Claude 3.5 Sonnet) pueden ser "jailbroken" usando tácticas de ingeniería social humana, sugiriendo que heredan vulnerabilidades psicológicas de los datos de entrenamiento. La afirmación central es que estos fallos de alineación no son exploits matemáticos, sino una consecuencia de simular rasgos humanos, lo que hace a los LLMs susceptibles a la manipulación social.

44