人工智能数据集划分脚本

2021-07-18

人工智能数据集划分脚本

描述

本脚本用于划分训练集和测试集,操作简单且高效。其原理是通过提取目录中的文件名称,随机打乱后放入数组中,再对数组中的内容进行对比,提取存在标签的图片,最终将图片和标签划分到训练集、验证集和测试集。

使用方法

  1. 自动选择根路径:默认情况下,脚本提供了一个自动选择根路径的函数。如果你不做任何修改,可以直接按要求选择未划分的数据集即可。
  2. 划分比例
    • 训练集:70%
    • 验证集:20%
    • 测试集:10%

注意事项

  • 确保数据集目录结构符合脚本要求。
  • 脚本会自动处理文件名称的随机打乱和划分,无需手动干预。

适用场景

适用于需要对人工智能数据集进行训练集、验证集和测试集划分的场景,尤其适合初学者和需要快速处理数据集的用户。

下载链接

人工智能数据集划分脚本