跳到主要内容

数据格式:目标检测

介绍#

目标检测由于 Label 字段内容多,所以使用单独的 JSON 文件作为标注,001.jpg 是一张原图,001.json 则是该图中若干个目标物体的标注和对应标签。

样例#

meta.csv
json_Label,image_Sourcelabels/001.json,images/001.jpg

目标检测的 JSON 标注内容,是标注框和对应的内容和属性,标注框包括分为两点框和四点框:

  • 两点框是左上角(x_min 和 y_min)和右下角(x_max 和 y_max)两个点
  • 四点框是从任一点(左上点)开始顺时针方向的4个点坐标。四点框可以是矩形框也可以是一般四边形

标注坐标使用的是点在图片上的相对位置,例如:图片大小(800, 600),点坐标(10,30),则标注框的表示为(10/800,30/600),即(0.125,0.05)。

字段说明#

  • image_width - 该图片的宽度
  • image_height - 该图片的高度
  • image_path - 该图片文件的相对路径
  • num_box - 该图片上的标注框数目
  • bboxes - 该图片上的标注框列表
    • attributions - 数据集自定义使用的属性值(训练不使用,但是有保留意义的标注)
    • label - 该框的类型标注
    • x_min / y_min - 两点框左上角坐标
    • x_max / y_max - 两点框右下角坐标
    • x_arr - 四点框四点依次 x 坐标
    • y_arr - 四点框四点依次 y 坐标

两点框标注样例#

{  "bboxes": [    {      "attributions": {        "group": 0      },      "id": 0,      "label": "ball",      "x_max": 0.853887,      "x_min": 0.700299,      "y_max": 0.099826,      "y_min": 0.050272    },    {      "attributions": {        "group": 0      },      "id": 1,      "label": "ball",      "x_max": 0.719806,      "x_min": 0.692791,      "y_max": 0.163233,      "y_min": 0.110261    }  ],  "image_height": 419,  "image_path": "8/ballet_106_0.jpg",  "image_width": 600,  "num_box": 2}

四点框标注样例#

{  "bboxes": [    {      "attributions": {        "group": 0      },      "id": 0,      "label": "ball",      "x_arr": [        0.700982,        0.853886,        0.853203,        0.700299      ],      "y_arr": [        0.050271,        0.055058,        0.099825,        0.095039      ]    },    {      "attributions": {        "group": 0      },      "id": 1,      "label": "ball",      "x_arr": [        0.698083,        0.719805,        0.714512,        0.692790      ],      "y_arr": [        0.110260,        0.115165,        0.163232,        0.158328      ]    }  ],  "image_height": 419,  "image_path": "8/ballet_106_0.jpg",  "image_width": 600,  "num_box": 2}