data-explorer

extract cropped 'ltrb' data

download amazon s3 file

How to install

Install dependency :
```
$ pip install -r requirements.txt
```
Put secret.json file inside directory
```
Ask JunyongPark
```

data extract to csv & download image from Monde-data-server

저장 형식은 left, top, bottom, origin_url, width, height : ltrb는 비율이 아닌 픽셀값

monde_data_extract.ipynb

make instance

$ extractmanager= DataExtractSave()
$ imagedownloadmanager = S3DownloadManager()

make queryset

$ queryset = CroppedImage.objects.filter(origin_source__image_review=True)

save_data_to_csv & download s3 file from queryset : 데이터 csv로 저장 & queryset 기반으로 s3 image file 저장

save_data_to_csv('저장할 파일이름', 쿼리셋) --> 쿼리셋은 sliced 되면 오류가 납니다.(err: queryset = Queryset[:100]) image 다운받을 때 다운받는 폴더는 미리 생성되어있어야 합니다.
```
$ extractmanager.save_data_to_csv("20191106_tight_boxed_data.csv", queryset)
$ imagedownloadmanager.download_s3_files_from_queryset('./data/', queryset)
```

download S3 images to local [DEPRECATED]

download_s3_files.ipynb

s3에 업로드된 이미지들이 다른 bucket에 있어 두곳에서 다르게 다운받아야 함. csv와, 버킷 이름을 지정해 줘야 사용 가능합니다.

make instance
```
$ s3manager = S3Manager()
```
download from monde-data : BucketNmae --> 크롤링 파일들 박싱한 데이터 저장한 버킷

s3manager.download_s3_files('버킷이름', ''폴더이름, 'csv파일', '저장경로')
```
$ s3manager.download_s3_files('monde-data', 'original-bag-images-dev', './crop_download_test.csv', './data/')
```
download from temp-originalimage : BucketNmae --> hdf5파일들 저장한 버킷

s3manager.download_s3_files('버킷이름', ''폴더이름, 'csv파일', '저장경로') --> 폴더가 없으므로 비워둠
```
$ s3manager.download_s3_files('temp-originalimage', '', './s3upload_download_test.csv', './data/')
```

TODO

data extract & download from Mondebro (web-crawler bucket data)

Name		Name	Last commit message	Last commit date
Latest commit History 41 Commits
data_management		data_management
monde		monde
mondebro		mondebro
training_csv_files		training_csv_files
web_crawler		web_crawler
.gitignore		.gitignore
Pipfile		Pipfile
Pipfile.lock		Pipfile.lock
README.md		README.md
Search_Logic.ipynb		Search_Logic.ipynb
Search_Logic_v2.ipynb		Search_Logic_v2.ipynb
django_settings.py		django_settings.py
download_s3_files.ipynb		download_s3_files.ipynb
image_upload_to_s3_temp.ipynb		image_upload_to_s3_temp.ipynb
loader.py		loader.py
monde_data_extract.ipynb		monde_data_extract.ipynb
monde_data_server.ipynb		monde_data_server.ipynb
requirements.txt		requirements.txt
routers.py		routers.py
test_categories_input-mondebro.ipynb		test_categories_input-mondebro.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

data-explorer

How to install

data extract to csv & download image from Monde-data-server

저장 형식은 left, top, bottom, origin_url, width, height : ltrb는 비율이 아닌 픽셀값

download S3 images to local [DEPRECATED]

s3에 업로드된 이미지들이 다른 bucket에 있어 두곳에서 다르게 다운받아야 함. csv와, 버킷 이름을 지정해 줘야 사용 가능합니다.

TODO

About

Releases

Packages

Contributors 2

Languages

mondeique/data-explorer

Folders and files

Latest commit

History

Repository files navigation

data-explorer

How to install

data extract to csv & download image from Monde-data-server

저장 형식은 left, top, bottom, origin_url, width, height : ltrb는 비율이 아닌 픽셀값

download S3 images to local [DEPRECATED]

s3에 업로드된 이미지들이 다른 bucket에 있어 두곳에서 다르게 다운받아야 함. csv와, 버킷 이름을 지정해 줘야 사용 가능합니다.

TODO

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages