数据格式:目标检测
介绍
目标检测由于 Label 字段内容多,所以使用单独的 JSON 文件作为标注,001.jpg 是一张原图,001.json 则是该图中若干个目标物体的标注和对应标签。
样例
meta.csv
json_Label,image_Source
labels/001.json,images/001.jpg
目标检测的 JSON 标注内容,是标注框和对应的内容和属性,标注框包括分为两点框和四点框:
- 两点框是左上角(x_min 和 y_min)和右下角(x_max 和 y_max)两个点
- 四点框是从任一点(左上点)开始顺时针方向的4个点坐标。四点框可以是矩形框也可以是一般四边形
标注坐标使用的是点在图片上的相对位置,例如:图片大小(800, 600),点坐标(10,30),则标注框的表示为(10/800,30/600),即(0.125,0.05)。
字段说明
- image_width - 该图片的宽度
- image_height - 该图片的高度
- image_path - 该图片文件的相对路径
- num_box - 该图片上的标注框数目
- bboxes - 该图片上的标注框列表
- attributions - 数据集自定义使用的属性值(训练不使用,但是有保留意义的标注)
- label - 该框的类型标注
- x_min / y_min - 两点框左上角坐标
- x_max / y_max - 两点框右下角坐标
- x_arr - 四点框四点依次 x 坐标
- y_arr - 四点框四点依次 y 坐标
两点框标注样例
{
"num_box": 2,
"bboxes": [
{
"attributions": {
"group": 0
},
"id": 0,
"label": "ball",
"x_max": 0.853887,
"x_min": 0.700299,
"y_max": 0.099826,
"y_min": 0.050272
},
{
"attributions": {
"group": 0
},
"id": 1,
"label": "ball",
"x_max": 0.719806,
"x_min": 0.692791,
"y_max": 0.163233,
"y_min": 0.110261
}
],
"image_path": "8/ballet_106_0.jpg",
"image_width": 600,
"image_height": 419,
}
四点框标注样例
{
"num_box": 2,
"bboxes": [
{
"id": 0,
"attributions": {
"group": 0
},
"label": "ball",
"x_arr": [ 0.700982, 0.853886, 0.853203, 0.700299],
"y_arr": [ 0.050271, 0.055058, 0.099825, 0.095039]
},
{
"id": 1,
"attributions": {
"group": 0
},
"label": "ball",
"x_arr": [ 0.698083, 0.719805, 0.714512, 0.692790],
"y_arr": [ 0.110260, 0.115165, 0.163232, 0.158328]
}
],
"image_path": "8/ballet_106_0.jpg",
"image_width": 600,
"image_height": 419,
}