一、语音识别语料库

一、语音识别语料库（OpenSLR网站：http://www.openslr.org/）
（一）TIMIT语料库
630个说话者的宽带录音，8个主要方言区的美式英语，每人10句。
（二）LibriSpeech语料库
大型英语阅读语料库，没有标记。
（三）中文语料库

（四）Aishell1语料库

开源178小时的中文普通话数据库。
人数：400名，男女比例均衡（男186人，女214人）。
文本相关数据集：按照设计好的文本，在相对安静环境中使用手机（Android和IOS 系统）录制格式为16kHz、16bit单声道数据和高保真麦克风录制格式为44.1kHz、16bit单声道数据同时采集。
下载地址
参考：AISHELL-1 开源中文语音数据库

（五）Voxceleb1语料库

（六）CSTR VCTK语料库

109个以英语为母语的本地人。
每个演讲者朗读大约400句话，其中大部分是从报纸中选出的。
音频设置：全向头戴式麦克风（DPA 4035），96 kHz采样频率（24位）和爱丁堡大学的半消声室。将所有记录转换为16位，根据STPK向下采样至48 kHz，并手动进行端点设置。
参考：SUPERSEDED - CSTR VCTK Corpus: English Multi-speaker Corpus for CSTR Voice Cloning Toolkit
Noisy speech database for training speech enhancement algorithms and TTS models