新鲜出炉的盲道检测开源数据集(TP-Dataset)
介绍
TP-Dataset是一个专门为盲道检测设计的开源数据集,旨在通过视觉分割技术提高盲人出行的便利性。该数据集包含了多场景、多样化的图片,以及详细的特征和实验结果,对无障碍科技研究具有重要价值。
数据集特点
- 场景多样性:数据集包含了校园、街道、火车站、公交站、地铁、社区和医院等多种典型场景,总共有1391张包含盲道的图片。
- 数据来源:大部分图片是在实际环境中通过不同类型的摄像机或手机摄像头拍摄的,其余图片则从网上搜索和下载。拍摄图片和在线图片的数量分别为828和563。
- 观察角度:拍摄图片时,摄像机或手机摄像头固定在相机架上或手持,水平角度或略微倾斜,高度在0.8米到1.8米之间。大部分在线图片也遵循这一规则,其他图片则由监控摄像头在高处拍摄。
- 外观风格:盲道样式包括用于指示方向的条形砖和用于警告障碍物或角落的点状砖。
- 图像分辨率:为了统一处理,所有图片的最小边被调整为283像素,同时保持图像的宽高比不变。
- 光照条件:大部分图片在白天拍摄,部分图片在夜间或傍晚拍摄,使用路灯或相机闪光灯照明。白天和夜间图片的数量分别为1289和102。
- 数据标注:盲道区域通过基于像素的掩码进行标注,目标以灰度图像格式保存,盲道值为255,背景值为0。
- 数据划分:图片根据场景类型和数据来源分为九部分,随机分配到训练集、验证集和测试集,数量分别为824、281和286。
实验结果
数据集的实验结果表明,GRFB-UNet模型在盲道检测任务中表现优异,具有较高的MIoU、mPA、Accuracy、IoU、Recall和Precision。
使用许可
该数据集遵循Creative Commons Attribution-NonCommercial-ShareAlike 3.0 License,使用时需注明出处,不得用于商业用途,且衍生作品需遵循相同许可协议。
贡献者
感谢以下贡献者在数据集收集和标注过程中的努力:
- Jing Lee
- Mingshuai Li
- Ruize Li
- Lei Liang
- Jinyu Liu
- Yaru Shang
- Wenzhe Tang
- Gusheng Tian
- Kunli Wu
- Zhihui Wang
- Xingli Zhang
- Shenglu Zhao
相关论文
详细的技术细节和实验结果可参考论文《GRFB-UNet: A new multi-scale attention network with group receptive field block for tactile paving segmentation》。
下载链接
数据集和相关代码的下载链接可在相关资源页面获取。
通过使用TP-Dataset,研究人员和开发者可以更有效地训练和评估盲道检测模型,进一步推动无障碍科技的发展,为盲人提供更安全、便捷的出行环境。