O projeto final do módulo 6, do programa PoloTech - Ada, foi sugerido pelos professores a fim de estimular os alunos a se dividirem em grupos e desenvolverem uma aplicação de Machine Learning utilizando a biblioteca PySpark em um ambiente cloud, sendo o banco de dados por escolha dos integrantes do grupo, seguindo os diferentes métodos e procedimentos abordados durantes as aulas.
O arquivo "Enunciado_Projeto_de_Big_Data-Americanas_DS.ipynb" contém a descrição geral do projeto, disponibilizado pelos professores para que os alunos pudessem seguir como base para execução do projeto final.
O arquivo "Projeto_final_big_data.py" contém o algoritmo escrito pelo grupo, para realização da tarefa proposta pelos professores e descrita no arquivo do enunciado.
o arquivo "apresentacao_projeto_final_big_data.ipynb" contém o notebook explicativo do algoritmo do projeto final, desenvolvido pelo grupo.
Os integrantes do grupo são:
- Gustavo Wohlers (linkedin; GitHub)
- Karine Alves (linkedin; GitHub)
- Luiz Fonseca (linkedin; GitHub)
- MaÃsa Santos (linkedin; GitHub)
- Pablo Brito (linkedin; GitHub)
- Victor Hugo (linkedin; Github)
OBS: este passo-a-passo foi feito em um SO Windows. No entanto, usuários de outros SO não devem ter muito problema na execução, uma vez que os passos são bem similares.
Para executar essa aplicação localmente, basta seguir os passos abaixo:
-
Faça download dos arquivos "Projeto_final_big_data.py" e "requirements.txt", deste repositório, em uma pasta separada;
-
Faça download do dataset através deste link e salve-o na mesma pasta criada no passo anterior;
-
Descompacte o arquivo do dataset, copie o path e substitua-o na linha 21 do arquivo "Projeto_final_big_data.py"
-
Abra seu editor de código nesta pasta e execute o comando abaixo no terminal, para instalar as bibliotecas necessárias (caso você não as tenha):
pip install -r requirements.txt
OBS: É recomendado a criação de um ambiente separado.
-
Execute o comando abaixo para iniciar a aplicação:
uvicorn Projeto_final_big_data:app --reload
-
Um IP será disponibilizado. Abra-o (CRTL + Botão esquerdo do mouse) assim que a execução do comando acima estiver concluÃda.
OBS: para finalizar a execução da aplicação, basta apertar "CRTL + C" no terminal.
Pronto, a aplicação deve funcionar normalmente. No entanto, é importante destacar que, à depender da máquina, a execução do comando do passo 3 pode levar alguns minutos para ser concluÃda, assim como as requisições feitas à aplicação quando esta estiver sendo executada.