跳到主要内容

数据格式:目标检测

介绍

目标检测由于 Label 字段内容多,所以使用单独的 JSON 文件作为标注,001.jpg 是一张原图,001.json 则是该图中若干个目标物体的标注和对应标签。

样例

meta.csv
json_Label,image_Source
labels/001.json,images/001.jpg

目标检测的 JSON 标注内容,是标注框和对应的内容和属性,标注框包括分为两点框和四点框:

  • 两点框是左上角(x_min 和 y_min)和右下角(x_max 和 y_max)两个点
  • 四点框是从任一点(左上点)开始顺时针方向的4个点坐标。四点框可以是矩形框也可以是一般四边形

标注坐标使用的是点在图片上的相对位置,例如:图片大小(800, 600),点坐标(10,30),则标注框的表示为(10/800,30/600),即(0.125,0.05)。

字段说明

  • image_width - 该图片的宽度
  • image_height - 该图片的高度
  • image_path - 该图片文件的相对路径
  • num_box - 该图片上的标注框数目
  • bboxes - 该图片上的标注框列表
    • attributions - 数据集自定义使用的属性值(训练不使用,但是有保留意义的标注)
    • label - 该框的类型标注
    • x_min / y_min - 两点框左上角坐标
    • x_max / y_max - 两点框右下角坐标
    • x_arr - 四点框四点依次 x 坐标
    • y_arr - 四点框四点依次 y 坐标

两点框标注样例

{
"num_box": 2,
"bboxes": [
{
"attributions": {
"group": 0
},
"id": 0,
"label": "ball",
"x_max": 0.853887,
"x_min": 0.700299,
"y_max": 0.099826,
"y_min": 0.050272
},
{
"attributions": {
"group": 0
},
"id": 1,
"label": "ball",
"x_max": 0.719806,
"x_min": 0.692791,
"y_max": 0.163233,
"y_min": 0.110261
}
],
"image_path": "8/ballet_106_0.jpg",
"image_width": 600,
"image_height": 419,
}

四点框标注样例

{
"num_box": 2,
"bboxes": [
{
"id": 0,
"attributions": {
"group": 0
},
"label": "ball",
"x_arr": [ 0.700982, 0.853886, 0.853203, 0.700299],
"y_arr": [ 0.050271, 0.055058, 0.099825, 0.095039]
},
{
"id": 1,
"attributions": {
"group": 0
},
"label": "ball",
"x_arr": [ 0.698083, 0.719805, 0.714512, 0.692790],
"y_arr": [ 0.110260, 0.115165, 0.163232, 0.158328]
}
],
"image_path": "8/ballet_106_0.jpg",
"image_width": 600,
"image_height": 419,
}