语音增强、识别、评测常用噪声库、数据集
本资源文件提供了语音增强、识别和评测领域常用的噪声库和数据集,适用于研究和开发相关应用。以下是资源文件中包含的主要内容:
噪声库
NoiseX-92
包含15种噪声:
- White noise
- Pink noise
- HF channel noise
- Speech babble
- Factory floor noise 1
- Factory floor noise 2
- Jet cockpit noise 1
- Jet cockpit noise 2
- Destroyer engine room noise
- Destroyer operations room noise
- F-16 cockpit noise
- Military vehicle noise
- Tank noise
- Machine gun noise
- Car interior noise
DEMAND噪声库
包含多通道的真实环境噪声。
TUT声学场景
包含15个声学场景的音频片段:
- Bus - traveling by bus in the city (vehicle)
- Cafe / Restaurant - small cafe/restaurant (indoor)
- Car - driving or traveling as a passenger in the city (vehicle)
- City center (outdoor)
- Forest path (outdoor)
- Grocery store - medium size grocery store (indoor)
- Home (indoor)
- Lakeside beach (outdoor)
- Library (indoor)
- Metro station (indoor)
- Office - multiple persons, typical work day (indoor)
- Residential area (outdoor)
- Train (traveling, vehicle)
- Tram (traveling, vehicle)
- Urban park (outdoor)
voxceleb dataset
包含噪声:环境突发噪声、背景人声、笑声、回声、室内噪音、录音设备噪音。
数据集
VACE数据集
主要用于探索和开发语音增强技术,特别是通过视觉信息(例如嘴部运动)或视听信息(同时使用音频和视频)来提升语音信号的质量和清晰度。
使用说明
本资源文件为研究人员和开发者提供了一个用于开发和评估语音增强、识别和评测算法的基准。通过使用这些噪声库和数据集,可以提高模型的鲁棒性和泛化能力。
注意事项
- 数据集和噪声库仅供研究和开发使用,请遵守相关版权协议。
- 在使用数据集时,请确保数据的标注和处理符合研究需求。
希望本资源文件能为您的研究和开发工作提供帮助。