目标检测——数据获取和标注(一)

目标检测的任务

  1. 目标检测主要是针对图像视觉的一种方法,根据学习到的目标,将目标区域进行位置定位和类别识别,同时需要给出给目标的置信度。
  2. 如下图所示,输入一张图片,它能够通过目标检测方法,识别出汽车的位置(坐标信息),并给予瞄框,并标注出类别名称,及其置信度值为{0,1}范围内的一个数值。

在这里插入图片描述

数据集的获取

拍摄照片是,需要注意进行多方位的拍摄,采用不同的角度,不同的背景来进行拍摄,同时需要注意数据的多样性。

  1. 数据集下载
    数据集:自行车数据集
    数据集下载:数据集下载

  2. 数据集的标注
    使用:labelme 来对数据标准。
    labelme的标注按照见github:github标注下载

  3. 标注好的数据处理成能输入的数据集的形式。
    目标检测的数据格式一般有两种,voc和COCO的形式。如果使用COCO格式,建议使用PaddleDetection中的x2coco将标注好的文件转为COCO格式的数据集。转换代码如下:

python tools/x2coco.py \
                --dataset_type labelme \
                --json_input_dir ./labelme_annos/ \
                --image_input_dir ./labelme_imgs/ \
                --output_dir ./cocome/ \
                --train_proportion 0.8 \
                --val_proportion 0.2 \
                --test_proportion 0.0

在这里插入图片描述
如果使用VOC格式的数据集,可以使用labelme自带的labelme2voc.py完成,需要先创建labels.txt文件,labels.txt文件的前两行分别为__ignore__和_background_,其余行为类别名称。转换代码如下:

./labelme2voc.py data_annotated data_dataset_voc --labels labels.txt

版权声明:本文为qq_38978225原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。