← heapsort-ai

social media data

3 items

DOCDEV.to AI·hace 28d

Scraping Chinese Social Platforms for LLM Training Data: A Practical Multi-Source Pipeline (Python, 2026)

Esta publicación aborda el cuello de botella de los datos en chino para el entrenamiento de LLMs y propone un pipeline práctico de múltiples fuentes. Detalla cómo extraer datos limpios y estructurados de plataformas sociales chinas como Weibo, Bilibili y Xiaohongshu para enriquecer los conjuntos de datos de entrenamiento.

27
DOCDEV.to AI·hace 29d

Scraping Twitter/X: The 2026 Guide

Esta guía aborda la frustración por los muros de pago para acceder a los datos de Twitter/X, ofreciendo una hoja de ruta para el raspado eficaz y legal en 2026. Su objetivo es capacitar a desarrolladores, investigadores y especialistas en marketing para extraer datos cruciales de la plataforma sin incurrir en costes elevados.

12
ARTICLEDEV.to AI·27/4/2026

How I'd Build an Audience Quality Audit Before Paying Creators

El autor describe un enfoque práctico y estructurado para auditar la calidad de la audiencia en el marketing de influencers, con el objetivo de evitar el desperdicio de dinero al centrarse en señales de compromiso creíbles en lugar de métricas superficiales o soluciones de "IA falsa". La publicación detalla cómo construir esta auditoría usando JavaScript y Python con datos sociales públicos.

6