← heapsort-ai

cybersecurity

132 items

RESEARCHDEV.to AI·vor 26T

The Convergence of Cloud Secrets & AI Risk

Der SentinelOne-Bericht 2025-2026 identifiziert die Einführung von KI und LLMs als Haupttreiber des modernen Cloud-Risikos, mit einem Anstieg von 140% bei KI-spezifischen Geheimnissen und dem Aufkommen von „Schatten-KI“. Dies schafft einzigartige Angriffsvektoren wie Prompt-Injection und unbefugten Datenzugriff, während traditionelle Schwachstellen ebenfalls kritische Cloud-Kompromittierungen ermöglichen.

27
ARTICLEDEV.to AI·vor 13T

AI Prompt Injection Defense: Building Effective Strategies in 5 Steps

Eine LLM-Integration erlitt einen Prompt-Injection-Angriff, wodurch das Modell Systemkonfigurationen anstelle einer Datenabfrage preisgab. Dieser Vorfall unterstreicht die erheblichen Sicherheitsrisiken, die von LLMs ausgehen, insbesondere bei sensiblen Unternehmensdaten, und der Autor schlägt eine 5-Schritte-Strategie zur Minderung dieser Bedrohungen vor.

27
NEWSDEV.to AI·vor 27T

Inside CrowdStrike Automated Leads: A Transformative Approach to Threat Detections

CrowdStrike hat Automated Leads eingeführt, eine neue Bedrohungsdetektionsfunktion, die auf selbstlernenden KI-Modellen in der CrowdStrike Signal Engine basiert. Dieses System priorisiert Ereignisse basierend auf deren aggregierten Auswirkungen auf bestimmte Hosts, was die Erkennung von ausgeklügeltem Angreiferverhalten und anomalem RMM-Tool-Einsatz ermöglicht, der sonst unbemerkt bliebe.

27
NEWSDEV.to AI·vor 28T

Google: Hackers used AI to develop zero-day exploit for web admin tool

Die Google Threat Intelligence Group (GTIG) hat einen Zero-Day-Exploit für ein Web-Administrationstool identifiziert, der wahrscheinlich mit KI entwickelt wurde und die Zwei-Faktor-Authentifizierung umgeht. Diese Entdeckung unterstreicht eine Verschiebung in der Methodik von Bedrohungsakteuren hin zur KI-gestützten Schwachstellenfindung und der zunehmenden Industrialisierung des KI-Einsatzes durch staatlich geförderte Gruppen.

27
ARTICLEDEV.to AI·4/15/2026

Enterprise AI Security in 2026: A Practical Guide for Modern Organizations

Dieser Artikel erörtert, wie die rasche Einführung von künstlicher Intelligenz in Unternehmen ein Umdenken in der Sicherheit erfordert, da KI-Systeme neue Angriffsflächen schaffen, die von traditioneller Cybersicherheit nicht abgedeckt werden. Er thematisiert Herausforderungen wie die Exposition sensibler Daten, Prompt-Injection-Angriffe und Modellmanipulation und betont die Notwendigkeit, Modelle, Daten und Entscheidungen in einer KI-gesteuerten Umgebung zu schützen.

27
RESEARCHarXiv CS.CL·vor 25T

VectraYX-Nano: A 42M-Parameter Spanish Cybersecurity Language Model with Curriculum Learning and Native Tool Use

VectraYX-Nano ist ein 42-Millionen-Parameter-Sprachmodell in Spanisch, das von Grund auf für Cybersicherheit trainiert wurde, mit lateinamerikanischem Fokus und nativer Werkzeugaufruf-Funktionalität. Die Forschung beschreibt seinen kundenspezifischen Korpus, die Transformer-Architektur und die Curriculum-Lernmethodik mit Replay.

27
NEWSThe Verge AI·4/17/2026

Anthropic’s new cybersecurity model could get it back in the government’s good graces

Die angespannte Beziehung Anthropic's zur US-Regierung, geprägt von Anschuldigungen und ethischen roten Linien bezüglich Überwachung und autonomer Waffen, zeigt Anzeichen einer Verbesserung. Dieser Wandel ist Berichten zufolge auf das neue cybersicherheitsorientierte KI-Modell des Unternehmens, Claude Mythos Preview, zurückzuführen, das es wieder in die Gunst der Regierung bringen könnte.

27
NEWSDEV.to AI·vor 25T

Agentic AI Red Teaming Emerges as Defence Against AI-Speed Attack Chains

Sweet Security hat 'Sweet Attack' eingeführt, eine kontinuierliche Agenten-KI-Red-Teaming-Plattform, die der wachsenden Asymmetrie zwischen KI-unterstützten Angreifern und menschlichen Verteidigern entgegenwirken soll. Die Plattform nutzt Laufzeit-Telemetriedaten aus der Kundenumgebung, um tatsächlich ausnutzbare Angriffsketten zu identifizieren, was eine branchenweite Verlagerung hin zu autonomen KI-Agenten in der Sicherheit signalisiert.

27
NEWSDEV.to AI·4/9/2026

Anthropic Just Did Something Unprecedented: They Hid Their Best Security Model

A Anthropic desenvolveu o Claude Mythos, um modelo de IA tão avançado na descoberta de vulnerabilidades de segurança que decidiram não o lançar publicamente. Em vez disso, criaram o Project Glasswing, um programa restrito que dá acesso a pesquisadores e empresas selecionadas, destacando a capacidade sem precedentes do modelo em encontrar e encadear exploits complexos, incluindo uma falha de 27 anos no OpenBSD.

27
ARTICLEDEV.to AI·4/14/2026

Why AI Agents Are the New Attack Vector

Der Artikel argumentiert, dass traditionelle Sicherheitsmodelle aufgrund von KI-Agenten, die autonom agieren und neue Angriffsflächen schaffen, tot sind. Ein großangelegter autonomer Cyberangriff im September 2025, an dem eine staatlich unterstützte Gruppe und Claude Code beteiligt waren, markierte den Beginn der Ära agentischer Angriffe.

27
NEWSDEV.to AI·4/17/2026

Frontier AI Can't Hack Corporate Networks? Claude Mythos Just Did It in 20 Hours.

Claude Mythos, ein KI-Modell, absolvierte erfolgreich einen 32-stufigen Unternehmensnetzwerkangriff in 20 Stunden und widerlegte damit den Mythos, dass fortschrittliche KI keine mehrstufigen Cyberangriffe ausführen kann. Eine unabhängige Bewertung durch das britische AI Security Institute (AISI) bestätigte, dass Mythos ihre schwierigste Cyber-Range löste und bei 73 % der Expertenherausforderungen erfolgreich war.

27
RESEARCHarXiv CS.AI·5/6/2026

Stable Agentic Control: Tool-Mediated LLM Architecture for Autonomous Cyber Defense

Der Artikel stellt eine werkzeuggestützte LLM-Architektur für die autonome Cyberabwehr vor, die formale Garantien für hochriskante Entscheidungen unter adversarem Druck bieten soll. Er zertifiziert Steuerbarkeit, Beobachtbarkeit und Eingangs-zu-Zustands-Stabilitäts (ISS)-Robustheit durch eine maschinengeprüfte Lyapunov-Funktion und demonstriert deren Wirksamkeit bei realen Unternehmensangriffsgraphen.

27
NEWSThe Verge AI·4/7/2026

A new Anthropic model found security problems ‘in every major operating system and web browser’

A Anthropic está lançando um novo modelo de IA, Claude Mythos Preview, como parte do Project Glasswing, uma parceria de cibersegurança com grandes empresas de tecnologia. O modelo visa identificar vulnerabilidades em sistemas operacionais e navegadores, mas não será lançado publicamente devido a preocupações de segurança.

27