目标检测——数据获取和标注（一）

目标检测的任务

目标检测主要是针对图像视觉的一种方法，根据学习到的目标，将目标区域进行位置定位和类别识别，同时需要给出给目标的置信度。
如下图所示，输入一张图片，它能够通过目标检测方法，识别出汽车的位置（坐标信息），并给予瞄框，并标注出类别名称，及其置信度值为{0,1}范围内的一个数值。

在这里插入图片描述

数据集的获取

拍摄照片是，需要注意进行多方位的拍摄，采用不同的角度，不同的背景来进行拍摄，同时需要注意数据的多样性。

数据集下载
数据集：自行车数据集
数据集下载：数据集下载
数据集的标注
使用：labelme 来对数据标准。
labelme的标注按照见github:github标注下载
标注好的数据处理成能输入的数据集的形式。
目标检测的数据格式一般有两种，voc和COCO的形式。如果使用COCO格式，建议使用PaddleDetection中的x2coco将标注好的文件转为COCO格式的数据集。转换代码如下：

python tools/x2coco.py \
                --dataset_type labelme \
                --json_input_dir ./labelme_annos/ \
                --image_input_dir ./labelme_imgs/ \
                --output_dir ./cocome/ \
                --train_proportion 0.8 \
                --val_proportion 0.2 \
                --test_proportion 0.0

在这里插入图片描述
如果使用VOC格式的数据集，可以使用labelme自带的labelme2voc.py完成，需要先创建labels.txt文件,labels.txt文件的前两行分别为__ignore__和_background_，其余行为类别名称。转换代码如下：

./labelme2voc.py data_annotated data_dataset_voc --labels labels.txt

原文链接：https://blog.csdn.net/qq_38978225/article/details/124324751