heapsort
ARTICLE29

I spent 3 days scraping a site until I tried LLMs for data extraction

DEV.to AI·5 de junho de 2026

O autor passou três dias tentando fazer scraping de um site com classes HTML que mudavam constantemente, usando ferramentas como BeautifulSoup e regex, mas sem sucesso. A solução veio ao usar Modelos de Linguagem (LLMs) para tratar a página como um bloco de texto, focando na compreensão do significado em vez de encontrar padrões, o que transformou o processo de extração de dados.

Ler original