← heapsort-ai

training data

5 items

RESEARCH↑ trendingReddit r/MachineLearning·15/4/2026

Jailbreaks as social engineering: 5 case studies suggest LLMs inherit human psychological vulnerabilities from training data [D]

Este artículo documenta 5 estudios de caso que demuestran cómo los LLMs (GPT-4, GPT-4o, Claude 3.5 Sonnet) pueden ser "jailbroken" usando tácticas de ingeniería social humana, sugiriendo que heredan vulnerabilidades psicológicas de los datos de entrenamiento. La afirmación central es que estos fallos de alineación no son exploits matemáticos, sino una consecuencia de simular rasgos humanos, lo que hace a los LLMs susceptibles a la manipulación social.

44
ARTICLE↑ trendingReddit r/MachineLearning·10/4/2026

What image/video training data is hardest to find right now? [R]

Um usuário está desenvolvendo uma plataforma de coleta de fotos crowdsourced, utilizando YOLO/CLIP para rotulagem automática e enriquecimento de metadados. Ele busca sugestões sobre quais tipos de dados de imagem são mais difíceis de encontrar e mais desejados para o treinamento de modelos de IA, citando exemplos como cenas de rua europeias ou prateleiras de supermercado.

40
RESEARCHarXiv CS.CL·16/4/2026

Caption First, VQA Second: Knowledge Density, Not Task Format, Drives Multimodal Scaling

Este artículo sostiene que el cuello de botella principal en la escalabilidad multimodal de los MLLM es la densidad de conocimiento en los datos de entrenamiento, no el formato de la tarea. Demuestra que la supervisión específica de la tarea como VQA aporta poca información incremental más allá de los subtítulos de imagen y que aumentar la densidad de conocimiento mejora consistentemente el rendimiento.

27
ARTICLEDEV.to AI·15/4/2026

10 'Best GEO Tools' Listicles Exist. We're in Zero. Here's What That Teaches About AI Citations.

El autor observa que su herramienta GEO no figura en las listas de "mejores herramientas GEO" ni en las recomendaciones de IA, revelando que los modelos de IA referencian artículos indexados como datos de entrenamiento. Esto destaca un desafío de visibilidad para las herramientas que no aparecen en el contenido en línea establecido.

27