Este repositorio contiene un proyecto de web scraping enfocado en la extracción, transformación y carga (ETL) de datos de una página web relacionada con skateboards. El proyecto se basa en los conceptos aprendidos en FreeCodeCamp sobre web scraping.
El objetivo de este proyecto es mostrar un ejemplo práctico de web scraping aplicado a una tienda en línea de skateboards. Se utiliza Python junto con la biblioteca BeautifulSoup para extraer información relevante sobre productos, precios, descripciones, etc., y se realiza un proceso de ETL sobre estos datos obtenidos.
-
Scripts de Python: Encontrarás scripts de Python que realizan el web scraping utilizando BeautifulSoup para extraer datos de la web de skateboards.
-
Archivos de datos: Este repositorio contiene archivos de ejemplo resultantes del proceso de ETL, como archivos CSV o bases de datos, derivados de los datos extraídos de la web.
El proyecto demuestra un proceso completo de ETL:
-
Extracción: Se realizan solicitudes HTTP a la web objetivo y se extraen los datos relevantes utilizando técnicas de web scraping.
-
Transformación: Los datos extraídos pueden requerir ciertas transformaciones para limpiarlos, estructurarlos o prepararlos para su posterior análisis.
-
Carga: Los datos transformados se almacenan en archivos CSV, bases de datos u otros formatos que sean útiles para su uso posterior.