CCPD数据集下载链接
该数据集被分为3个部分:训练集、验证集和测试集,每个集合的标签可在splits
文件夹下发现。CCPD-Green数据集已经被分到不同的文件夹中,因此不需要标签。
图像的注释可在图像的文件名中找到,具体格式及描述可在官网查阅。
请从上述网站下载数据并解压缩文件。解压文件后,数据结构应该是这样的:
CCPD2019
|--- ccpd_base
| |--- <image_name>.jpg
| |--- <image_name>.jpg
| |--- ...
|--- ccpd_blur
| |--- <image_name>.jpg
| |--- <image_name>.jpg
| |--- ...
|--- ...
|--- ...
|--- ...
|--- splits
要准备用于文本检测的数据,您可以运行以下命令:
python tools/dataset_converters/convert.py \
--dataset_name ccpd --task det \
--image_dir path/to/CCPD2019/ccpd_base \
--label_dir path/to/CCPD2019/splits/train.txt \
--output_path path/to/CCPD2019/det_gt.txt
CCPD-Green数据集不需要
label_dir
。
运行后,在文件夹CCPD2019/
下会生成注释文件det_gt.txt
。