Skip to content

mauricioarcez/ETL_WebScraping

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Proyecto de Web Scraping para Skateboards

Este repositorio contiene un proyecto de web scraping enfocado en la extracción, transformación y carga (ETL) de datos de una página web relacionada con skateboards. El proyecto se basa en los conceptos aprendidos en FreeCodeCamp sobre web scraping.

Descripción del Proyecto

El objetivo de este proyecto es mostrar un ejemplo práctico de web scraping aplicado a una tienda en línea de skateboards. Se utiliza Python junto con la biblioteca BeautifulSoup para extraer información relevante sobre productos, precios, descripciones, etc., y se realiza un proceso de ETL sobre estos datos obtenidos.

Contenido del Repositorio

  • Scripts de Python: Encontrarás scripts de Python que realizan el web scraping utilizando BeautifulSoup para extraer datos de la web de skateboards.

  • Archivos de datos: Este repositorio contiene archivos de ejemplo resultantes del proceso de ETL, como archivos CSV o bases de datos, derivados de los datos extraídos de la web.

Proceso ETL (Extracción, Transformación y Carga)

El proyecto demuestra un proceso completo de ETL:

  • Extracción: Se realizan solicitudes HTTP a la web objetivo y se extraen los datos relevantes utilizando técnicas de web scraping.

  • Transformación: Los datos extraídos pueden requerir ciertas transformaciones para limpiarlos, estructurarlos o prepararlos para su posterior análisis.

  • Carga: Los datos transformados se almacenan en archivos CSV, bases de datos u otros formatos que sean útiles para su uso posterior.

About

Proyecto de Web Scraping con BeautifulSoup

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published