检测追踪数据集下载链接推荐
本资源文件提供了多个检测追踪数据集的下载链接推荐,涵盖了计算机视觉领域的多种数据集,适用于目标检测、分割、字幕生成等任务。以下是部分数据集的简要介绍:
目标追踪数据集
COCO
- 特点: 大规模对象检测、分割和字幕数据集。
- 图像数量: 超过330K张图像(>200K标记)。
- 对象实例: 150万个对象实例。
- 对象类别: 80个对象类别。
LaSOT
- 视频数量: 1400个视频。
- 帧数: 每个序列平均2512帧。
- 标注质量: 每一帧都经过仔细检查和手动标记。
GOT-10K
- 视频数量: 超过10,000条视频。
- 对象类别: 560多个类别。
- 标注: 所有物体的边界框均为手动标记。
TrackingNet
- 视频片段: 30643个视频片段。
- 帧数: 14431266帧图像,均使用bounding box进行标注。
其他数据集
ImageNet
- 图像数量: 超过1400万张图像。
- 标注: 手动注释图像中的对象,至少一百万个图像中提供了边界框。
Youtube-VOS
- 视频数量: 4,453个视频。
- 标注: 每5帧(6 fps)都有像素级的地面实况注释。
DAVIS
- 标注: 包含半监督集中所有公开可用帧的语义掩码。
ALOV300++
- 特点: 旨在对不同的光线、通透度、泛着条件、背景杂乱程度、焦距下的相似物体的追踪。
WebUAV-3M
- 视频序列: 4,500个视频序列。
- 标注: 密集标注了大约330万个高质量的边界框。
VisEvent
- 视频数量: 820个可见事件视频。
- 特点: 第一个从真实世界收集的用于单目标跟踪的大规模可视事件基准数据集。
TNL2K
- 特点: 专门为通过自然语言规范跟踪而设计。
KITTI
- 特点: 专注于自动驾驶领域的计算机视觉任务,如物体检测、分割和追踪。
Waymo Open Datasets
- 特点: 包含高分辨率传感器数据和用于2,030片段的标签的感知数据集。
NuScenes
- 特点: 大规模的自动驾驶数据集,具有用于在波士顿和新加坡收集的1000场景的3D边界框。
MONO
- 特点: 单目视觉里程(monocular Visual Odometry)和SLAM的跟踪精度评估数据集。
EuRoC
- 特点: 包含立体图像、同步IMU测量以及精确的运动和真实地面结构。
这些数据集为计算机视觉领域的研究和应用提供了丰富的资源,适用于各种目标检测、跟踪和分割任务。