ADE20K类别详情说明

2020-01-12

ADE20K类别详情说明

概览

本资源文件提供了ADE20K数据集的类别清单,这是一个广泛应用于计算机视觉任务,特别是语义分割和场景理解的重要数据集。ADE20K由麻省理工学院(MIT)发布,它包含了超过2万个带有精细标注的图像,覆盖了丰富的室内外场景,总计3688个类别,其中直接提供的类别数为150个,加上一个背景类(标为‘bg’),共151种不同的标签。

数据集特点

  • 图像数量:训练集25574张,验证集2000张。
  • 类别丰富性:覆盖365个不同的场景,拥有707868个独特对象的标注。
  • 注解详细:不仅有对象的语义分割,还包括部分分割,部分与部分的关系,以及对象的WordNet定义和层次关系。
  • 应用场景:适用于实例分割、语义分割和零部件分割的研究和开发。

内容概览

资源文件以txt格式提供,列出所有类别的ID、比例、训练集、验证集中的样本数及名称,方便研究人员快速了解每个类别的分布情况。例如,类别ID为1的是“wall”,训练集中有11664个样本,验证集为1172个,以此类推。

如何使用

  • 研究人员:可依据这份类别列表来设计和训练模型,尤其是在准备数据、评估类别平衡时非常有用。
  • 开发者:可作为映射表,将预测结果转换成具体类别名称。
  • 教育用途:教学过程中用于解释和展示对象识别的多样性。

注意事项

  • 本文件不含数据集本身,仅作为类别参考。
  • 使用数据集前,请遵守ADE20K的官方许可协议,并引用相应的研究成果。

获取数据集

虽然我们不直接提供数据集下载,但你可以参照提供的链接或访问MIT的官方网站获取ADE20K完整数据集及其相关资源。

通过这个详细的类别列表,您可以更好地准备您的实验,确保对数据集有一个全面的理解,从而加速您的计算机视觉项目研发进程。记得在引用数据或成果时,尊重原作者的工作,正确标注数据来源。

下载链接

ADE20K类别详情说明