training data

5 items

RESEARCH↑ trendingReddit r/MachineLearning·15/04/2026

Jailbreaks as social engineering: 5 case studies suggest LLMs inherit human psychological vulnerabilities from training data [D]

Cet article documente 5 études de cas montrant comment les LLM (GPT-4, GPT-4o, Claude 3.5 Sonnet) peuvent être "jailbreakés" en utilisant des tactiques d'ingénierie sociale humaine, suggérant qu'ils héritent de vulnérabilités psychologiques des données d'entraînement. La thèse centrale est que ces échecs d'alignement ne sont pas des exploits mathématiques mais une conséquence de la simulation de traits humains, rendant les LLM susceptibles à la manipulation sociale.

LLMs social engineering jailbreaks psychological vulnerabilities

ARTICLE↑ trendingReddit r/MachineLearning·10/04/2026

What image/video training data is hardest to find right now? [R]

Um usuário está desenvolvendo uma plataforma de coleta de fotos crowdsourced, utilizando YOLO/CLIP para rotulagem automática e enriquecimento de metadados. Ele busca sugestões sobre quais tipos de dados de imagem são mais difíceis de encontrar e mais desejados para o treinamento de modelos de IA, citando exemplos como cenas de rua europeias ou prateleiras de supermercado.

computer vision Image Annotation AI development Crowdsourcing

ARTICLEDEV.to AI·24/04/2026

Your AI Isn’t the Problem — Your Training Data Is (And It’s Riskier Than You Think)

La plupart des équipes d'IA négligent les risques cruciaux liés à leurs données d'entraînement, privilégiant les modèles et les benchmarks. Cette omission peut intégrer du contenu sensible, propriétaire ou sans licence, le rendant intraçable, indélébile et juridiquement risqué une fois intégré aux modèles d'IA.

data privacy security risk management training data

RESEARCHarXiv CS.CL·16/04/2026

Caption First, VQA Second: Knowledge Density, Not Task Format, Drives Multimodal Scaling

Cet article affirme que le principal goulot d'étranglement dans la mise à l'échelle multimodale des MLLM est la densité de connaissances dans les données d'entraînement, et non le format des tâches. Il montre que la supervision spécifique aux tâches, comme le VQA, ajoute peu d'informations sémantiques au-delà des légendes d'images et que l'augmentation de la densité de connaissances améliore constamment les performances.

multimodal AI LLMs machine learning Research Paper

ARTICLEDEV.to AI·15/04/2026

10 'Best GEO Tools' Listicles Exist. We're in Zero. Here's What That Teaches About AI Citations.

L'auteur constate que son outil GEO est absent des listes de "meilleurs outils GEO" et des recommandations d'IA, montrant que les modèles d'IA référencent les articles indexés comme données d'entraînement. Cela souligne un défi de visibilité pour les outils absents du contenu en ligne établi.

AI citations AI Generative Engine Optimization SEO