人工智能数据集划分脚本
描述
本脚本用于划分训练集和测试集,操作简单且高效。其原理是通过提取目录中的文件名称,随机打乱后放入数组中,再对数组中的内容进行对比,提取存在标签的图片,最终将图片和标签划分到训练集、验证集和测试集。
使用方法
- 自动选择根路径:默认情况下,脚本提供了一个自动选择根路径的函数。如果你不做任何修改,可以直接按要求选择未划分的数据集即可。
- 划分比例:
- 训练集:70%
- 验证集:20%
- 测试集:10%
注意事项
- 确保数据集目录结构符合脚本要求。
- 脚本会自动处理文件名称的随机打乱和划分,无需手动干预。
适用场景
适用于需要对人工智能数据集进行训练集、验证集和测试集划分的场景,尤其适合初学者和需要快速处理数据集的用户。