extract cropped 'ltrb' data
download amazon s3 file
-
Install dependency :
$ pip install -r requirements.txt
-
Put
secret.json
file inside directoryAsk JunyongPark
monde_data_extract.ipynb
-
make instance
$ extractmanager= DataExtractSave() $ imagedownloadmanager = S3DownloadManager()
-
make queryset
$ queryset = CroppedImage.objects.filter(origin_source__image_review=True)
-
save_data_to_csv & download s3 file from queryset : 데이터 csv로 저장 & queryset 기반으로 s3 image file 저장
save_data_to_csv('저장할 파일이름', 쿼리셋) --> 쿼리셋은 sliced 되면 오류가 납니다.(err: queryset = Queryset[:100]) image 다운받을 때 다운받는 폴더는 미리 생성되어있어야 합니다.
$ extractmanager.save_data_to_csv("20191106_tight_boxed_data.csv", queryset) $ imagedownloadmanager.download_s3_files_from_queryset('./data/', queryset)
download_s3_files.ipynb
-
make instance
$ s3manager = S3Manager()
-
download from monde-data : BucketNmae --> 크롤링 파일들 박싱한 데이터 저장한 버킷
s3manager.download_s3_files('버킷이름', ''폴더이름, 'csv파일', '저장경로')
$ s3manager.download_s3_files('monde-data', 'original-bag-images-dev', './crop_download_test.csv', './data/')
-
download from temp-originalimage : BucketNmae --> hdf5파일들 저장한 버킷
s3manager.download_s3_files('버킷이름', ''폴더이름, 'csv파일', '저장경로') --> 폴더가 없으므로 비워둠
$ s3manager.download_s3_files('temp-originalimage', '', './s3upload_download_test.csv', './data/')
- data extract & download from Mondebro (web-crawler bucket data)