行人重识别(ReID) ——数据集描述 Market-1501
数据集简介
Market-1501 数据集是一个广泛用于行人重识别(Person Re-identification,简称 ReID)研究的公开数据集。该数据集由来自市场环境的行人图像组成,包含超过 1501 个不同的行人身份。
数据集特点
- 大规模和多样性:Market-1501 数据集包含超过 32,000 个不同的行人图像,这些图像是在不同的天气条件、不同的场景和不同的时间拍摄的,使得数据集可以更好地模拟真实世界中的行人重识别问题。
- 多摄像头采集:数据集中的行人图像来自 6 个不同的摄像头,每个行人至少由 2 个摄像头捕获到,并且在一个摄像头中可能具有多张图像。
- 标注信息:每张图像都有对应的行人边界框和行人 ID,使得研究者可以使用这个数据集进行行人重识别算法的训练和评估。
数据集结构
Market-1501 数据集主要分为以下几个部分:
- bounding_box_test:用于测试集的 750 人,包含 19,732 张图像。
- bounding_box_train:用于训练集的 751 人,包含 12,936 张图像。
- query:为 750 人在每个摄像头中随机选择一张图像作为 query,共有 3,368 张图像。
- gt_query:matlab 格式,用于判断一个 query 的哪些图片是好的匹配(同一个人不同摄像头的图像)和不好的匹配(同一个人同一个摄像头的图像或非同一个人的图像)。
- gt_bbox:手工标注的 bounding box,用于判断 DPM 检测的 bounding box 是不是一个好的 box。
命名规则
以 0001_c1s1_000151_01.jpg
为例:
0001
表示每个人的标签编号,从 0001 到 1501。c1
表示第一个摄像头(camera1),共有 6 个摄像头。s1
表示第一个录像片段(sequece1),每个摄像机都有数个录像段。000151
表示 c1s1 的第 000151 帧图片,视频帧率 25fps。01
表示 c1s1_001051 这一帧上的第 1 个检测框,由于采用 DPM 检测器,对于每一帧上的行人可能会框出好几个 bbox,00
表示手工标注框。
测试协议
Market-1501 数据集使用 Cumulative Matching Characteristics (CMC) curves 作为行人重识别领域的性能评估方法。该方法考虑了 single-gallery-shot 和 multi-gallery-shot 情形下的识别准确率。
数据集应用
Market-1501 数据集已被广泛应用于行人检测、行人跟踪、行人重识别等研究领域,是评估和分析行人重识别算法的重要基础。
总结
Market-1501 数据集是一个用于行人重识别研究的重要资源,具有大规模和多样性的特点,可以帮助研究者更好地理解和解决行人重识别问题。