CUHK-SYSU行人搜索数据集介绍及结构
概述
CUHK-SYSU行人搜索数据集是一个专为行人检测与再识别设计的大规模基准数据集。它来源于两个不同的场景:街头抓拍和电影片段,旨在涵盖广泛的环境变化和挑战,如视角变换、光照条件、分辨率差异及遮挡情况。数据集总共包含了18,184张图像和8,432个独立的行人标识。
数据来源与组成
- 街拍: 收集了12,490张图像,涉及6,057个不同的查询人物,通过手持相机在多样的场景中捕捉。
- 电影: 选取了5,694张图像,包含2,375个查询人物,来自电影和电视剧,提供了更为复杂的视角和场景变化。
结构与标注
数据集被详细地划分,并提供了丰富的注解:
- Image/SSM:存放街拍与电影中收集的所有图像。
- Annotation 文件夹下包括三个关键部分:
Images.mat
:包含18,184个结构体,描述每张图像的行人位置信息。Person.mat
:共有11,934个结构体,每个代表一位行人,每位行人在至少两张图像中被标记。pool.mat
:测试集专用,列出6,978张图像的信息。
此外,测试集被细分为不同的子集,用于特定评估:
- Train_Test 子文件夹包含训练和测试查询人物。
- subset 子文件夹则专注于特定挑战,如遮挡 (
Occlusion
) 和低分辨率 (Resolution
) 的查询人物。
使用说明
- 训练集拥有11,206张图像与5,532个查询人物,而测试集包含6,978张图像和2,900个查询人物,确保了训练和验证数据的分离。
- 每个人物的位置标注采用矩形框形式
(xmin, ymin, width, height)
,便于提取感兴趣的行人区域。
应用价值
该数据集非常适合用于深度学习、行人检测与再识别的研究,以及开发能够跨场景识别特定行人的算法。它的多样性与规模使得它成为评估行人搜索算法性能的重要工具。
获取方式
数据集可通过提供的链接进行下载,确保遵守版权协议并在引用时附上原作者信息。
请注意,在使用数据集前应仔细阅读原始发布页面上的具体指示和许可条款,以合法合规地使用资源。