← heapsort-ai

training data

5 items

RESEARCH↑ trendingReddit r/MachineLearning·4/15/2026

Jailbreaks as social engineering: 5 case studies suggest LLMs inherit human psychological vulnerabilities from training data [D]

Dieser Bericht dokumentiert fünf Fallstudien, die zeigen, wie LLMs (GPT-4, GPT-4o, Claude 3.5 Sonnet) mittels menschlicher Social-Engineering-Taktiken gejailbreakt werden können, was darauf hindeutet, dass sie psychologische Schwachstellen aus ihren Trainingsdaten erben. Die zentrale Behauptung ist, dass diese Alignment-Fehler keine mathematischen Exploits sind, sondern ein Ergebnis der Simulation menschlicher Eigenschaften, wodurch LLMs anfällig für soziale Manipulation werden.

44
ARTICLE↑ trendingReddit r/MachineLearning·4/10/2026

What image/video training data is hardest to find right now? [R]

Um usuário está desenvolvendo uma plataforma de coleta de fotos crowdsourced, utilizando YOLO/CLIP para rotulagem automática e enriquecimento de metadados. Ele busca sugestões sobre quais tipos de dados de imagem são mais difíceis de encontrar e mais desejados para o treinamento de modelos de IA, citando exemplos como cenas de rua europeias ou prateleiras de supermercado.

40
RESEARCHarXiv CS.CL·4/16/2026

Caption First, VQA Second: Knowledge Density, Not Task Format, Drives Multimodal Scaling

Diese Arbeit argumentiert, dass der primäre Engpass beim multimodalen Skalieren von MLLMs die Wissensdichte in den Trainingsdaten und nicht das Aufgabenformat ist. Es demonstriert, dass aufgabenspezifische Supervision wie VQA kaum inkrementelle semantische Informationen über Bildunterschriften hinaus liefert und dass eine Erhöhung der Wissensdichte zu konsistenten Leistungsverbesserungen führt.

27
ARTICLEDEV.to AI·4/15/2026

10 'Best GEO Tools' Listicles Exist. We're in Zero. Here's What That Teaches About AI Citations.

Der Autor stellt fest, dass sein GEO-Tool weder in Listen der „besten GEO-Tools“ noch in KI-Empfehlungen auftaucht, was offenbart, dass KI-Modelle primär auf indizierte Artikel als Trainingsdaten zurückgreifen. Dies verdeutlicht eine erhebliche Herausforderung für die Marktsichtbarkeit von Tools, die nicht in etablierten Online-Inhalten erscheinen.

27