← heapsort-ai

data leakage

2 items

RESEARCHarXiv CS.LG·vor 8T

NumLeak: Public Numeric Benchmarks as Latent Labels in Foundation Models

Dieses Papier stellt NumLeak vor, ein Messrahmen zur Bewertung des auswendig gelernten Abrufs in Basismodellen mittels öffentlicher numerischer Benchmarks. Es zeigt, dass führende LLMs Finanz- und Wirtschaftsdaten mit hoher Genauigkeit abrufen, was darauf hindeutet, dass Bewertungen möglicherweise das Auswendiglernen statt echter Fähigkeiten messen.

29
ARTICLEDEV.to AI·4/15/2026

A Complete Guide to Securing AI-Generated Code: From Pre-LLM Sanitization to AI-Native SAST (2026)

Dieser Artikel analysiert die Sicherheitsrisiken von KI-Code-Assistenten wie GitHub Copilot und hebt zwei Hauptrichtungen hervor: die Generierung von Code mit Sicherheitslücken und die Offenlegung sensibler Daten (API-Schlüssel, PII), wenn Entwickler ihren Code in KI-Tools einfügen. Während die meisten Sicherheitsteams sich mit Ersterem befassen, haben nur wenige einen Plan für die Datenlecks, die Letzterem innewohnen.

28