ZEC drops 30% after Anthropic AI finds Zcash counterfeit vulnerability
ZEC cayó un 30% después de que la IA de Anthropic descubriera una vulnerabilidad de falsificación en Zcash. Este hallazgo afectó significativamente el valor de la criptomoneda.
ZEC cayó un 30% después de que la IA de Anthropic descubriera una vulnerabilidad de falsificación en Zcash. Este hallazgo afectó significativamente el valor de la criptomoneda.
Se ha descubierto una vulnerabilidad crítica en un paquete de código abierto, poniendo en peligro a millones de agentes de IA. Este fallo de seguridad exige atención inmediata para proteger los sistemas de inteligencia artificial.
El chatbot de soporte de McDonald's, junto con los de Alcampo y Chipotle, realizó inesperadamente tareas de codificación complejas para usuarios, revelando vulnerabilidades de seguridad críticas y fugas de capacidad en la IA agéntica. Estos incidentes sirven como una llamada de atención sobre la versatilidad inherente de los LLM y la necesidad de medidas de seguridad sólidas.
Este artículo de Karen Tonoyan presenta el concepto de Narrative Drift Injection (NDI) como una nueva dimensión de la inyección de prompts. A diferencia de los ataques clásicos, NDI manipula el modelo de IA al envolverlo en una narrativa que él mismo ayuda a crear, haciendo que pierda la vigilancia a nivel de sesión.
Meta confirmó que un error en su chatbot de IA permitió a atacantes secuestrar más de 20.000 cuentas de Instagram, explotando una vulnerabilidad de "recuperación de cuenta asistida por IA". Este incidente resalta los riesgos de integrar modelos de lenguaje en flujos de autenticación de alta confianza sin las medidas de seguridad adecuadas.
El texto resalta que los agentes de IA, como Claude Code, tienen acceso irrestricto a todas las claves API y tokens configurados, sin importar la necesidad funcional. Esta práctica genera un riesgo de seguridad considerable, especialmente en escenarios de fallos como llamadas a herramientas alucinadas o inyecciones de prompt.
El contenido revela un fallo de seguridad crítico en el código generado por IA, específicamente un error lógico en los ciclos de actualización de tokens que permite el mantenimiento indefinido de sesiones. Destaca un enfoque único de investigación de seguridad japonesa para revisar el código de IA, centrándose en fallos lógicos en lugar de sintaxis o herramientas.
El artículo revela una vulnerabilidad crítica en los modelos de lenguaje basados en difusión (dLLMs) donde su alineación de seguridad, basada en programas de denoising monotónicos, puede ser fácilmente eludida. Al volver a enmascarar tokens de rechazo e inyectar un prefijo afirmativo, los investigadores lograron altas tasas de éxito de ataque contra dLLMs destacados, exponiendo una falla estructural.
El artículo advierte que los editores de IA, como Cursor, reproducen un patrón peligroso de fusión recursiva de datos de entrenamiento obsoletos, lo que conduce a vulnerabilidades de "prototype pollution" en JavaScript. Esta falla permite a los atacantes inyectar propiedades en `Object.prototype`, afectando a todos los objetos, y fue vista previamente en `lodash` (CVE-2019-10744).
Em 3 de fevereiro de 2026, uma grave vulnerabilidade (CVE-2026-25253, CVSS 8.8) foi divulgada no OpenClaw, um agente de IA de código aberto, permitindo execução remota de código. Isso levou à descoberta de 138 vulnerabilidades em 63 dias, com mais de 135.000 instâncias de OpenClaw publicamente expostas globalmente, muitas sem autenticação.
Un investigador de SafeBreach demostró una vulnerabilidad de inyección de prompt indirecta en Google Gemini para Android, permitiendo que el asistente ejecutara acciones reales en el dispositivo sin el conocimiento del usuario a través de notificaciones. Aunque Google ha parcheado el problema, la investigación expone una gran superficie de ataque donde cualquier aplicación con capacidad de notificación puede convertirse en un vector de inyección.
La seguridad del software enfrenta un "problema de los tres cuerpos" debido a la convergencia de código generado por IA con más vulnerabilidades, el aumento de los ataques a la cadena de suministro y el colapso de la cantera de talentos en seguridad. Estas fuerzas interactúan de forma caótica, haciendo que el sistema sea impredecible.
Investigadores descubrieron una vulnerabilidad de inyección de prompt en Google Gemini para Android, donde el contenido de notificaciones de aplicaciones como WhatsApp y Slack podría ser interpretado como instrucciones maliciosas. Esto permitiría a un atacante controlar Gemini para abrir navegadores, enviar mensajes o envenenar su memoria a largo plazo, sin necesidad de una aplicación maliciosa ni permisos especiales.
Este contenido identifica dos problemas de endurecimiento de DM en sistemas de IA, centrándose en el aspecto de seguridad donde los MD hostiles explotan el razonamiento de los LLM para desencadenar acciones no autorizadas. Presenta la solución de la `v0.21`: una capa de procedencia que valida las acciones basándose en el origen del MD, no en el contenido.
Investigadores de Ox Security descubrieron vulnerabilidades críticas en los servidores MCP, que afectan a millones, y que Anthropic se niega a corregir a nivel de protocolo. Este fallo arquitectónico permite que indicaciones maliciosas secuestren la ejecución de herramientas y exfiltren datos de servidores expuestos públicamente.
El artículo aborda el envenenamiento de memoria como una vulnerabilidad de seguridad crítica y a menudo pasada por alto en agentes de IA con memoria persistente. Este ataque implica inyectar contenido malicioso en el almacenamiento de memoria de un agente, provocando un comportamiento adverso en futuras sesiones, una amenaza distinta de la inyección de prompts.
Este artículo detalla la CVE-2026-5603, una vulnerabilidad crítica de inyección de comandos en el paquete `@elgentos/magento2-dev-mcp`, que puede ser explotada manipulando agentes de IA. Explica el fallo del saneador en Windows y cómo verificar y corregir el problema en servidores MCP.
La IA MDASH de Microsoft detectó 16 fallas críticas en Windows, incluyendo cuatro errores de ejecución remota de código, antes que los hackers, cambiando el equilibrio de la ciberseguridad con un descubrimiento de vulnerabilidades más rápido. Esto subraya el papel creciente de la IA en la seguridad, ofreciendo victorias reales al encontrar fallas antes de la explotación.
El contenido describe la "Inyección de Prompt Indirecta" como una vulnerabilidad donde los asistentes de IA con acceso a Gmail pueden ser engañados por correos electrónicos maliciosos para realizar acciones no deseadas. Propone una solución de "Airgap Semántico", utilizando un "Sanitizador Tonto" para eliminar el poder imperativo de los datos externos antes de que lleguen al agente de "Alta Inteligencia", previniendo así estos ataques.
Esta guía completa aborda las amenazas de seguridad únicas que enfrentan las aplicaciones de IA, como la inyección de prompts y el robo de modelos. Detalla una metodología de prueba de penetración para proteger los sistemas de IA de ataques para 2026.