VoxCeleb数据集下载指南

2020-01-01

VoxCeleb数据集下载指南

简介

VoxCeleb数据集是一个广泛用于语音识别和说话人验证任务的开源数据集。该数据集包含了从YouTube视频中提取的大量语音片段,适用于各种语音相关的研究和应用。

数据集内容

VoxCeleb数据集主要分为两个版本:

  • VoxCeleb1: 包含来自1,251位名人的100,000多个语音片段。
  • VoxCeleb2: 包含来自6,112位名人的1,000,000多个语音片段。

下载方法

由于VoxCeleb官网的下载链接已被取消,目前可以通过以下步骤申请并下载数据集:

  1. 填写申请表: 访问指定链接,填写姓名、单位和单位邮箱等信息。
  2. 接收邮件: 提交申请后,检查邮箱收件箱(包括垃圾邮件),会收到一封包含下载链接的邮件。
  3. 下载数据集: 点击邮件中的下载链接,选择需要下载的数据集进行下载。

注意事项

  • 下载的数据集为压缩包格式,下载完成后需要合并所有压缩包并解压缩。
  • 由于数据集较大,建议使用高速网络进行下载。

数据集使用

下载并解压后的数据集可以直接用于语音识别、说话人验证等任务的研究和开发。

参考资料

更新日志

  • 2023-03-23: 更新下载方法,提供新的申请链接。

通过以上步骤,您可以顺利获取并使用VoxCeleb数据集进行相关研究。

下载链接

VoxCeleb数据集下载指南