TIMIT数据集转换成wav格式,可直接播放-python实现

下载得到的TIMIT数据集为虽然后缀为WAV,但是其实际是sphere格式,不能直接打开使用

在这里使用python实现转换,得到的音频可直接打开。

from sphfile import SPHFile
import glob
import os
#  将TIMIT语料库转换为wav格式
#  下载好的TIMIT语料库,不能直接读取和打开因为它是sphere格式
#  要转换成wav格式才能读取和打开,下面就是转化的代码

if __name__ == "__main__":
    #  TIMIT文件的路径 注意 r
    path = r'D:\111AA\SX194.WAV'
    # 多条语音转换
    # path = r'D:\1AADNN\DNN - IRM\TIMIT\TEST\*\*\*.WAV'
    sph_files = glob.glob(path)
    print(sph_files)
    print(len(sph_files), "个语音")
    for i in sph_files:
        sph = SPHFile(i)
        sph.write_wav(filename=i.replace(".WAV", "a.wav"))
        #  改名字,直接适用WAV到wav,不改名字,不成功
        #os.remove(i)  # 转换后,删除原始的语音文件
        print("处理完成!")

参考大哥的博客:

Timit 数据集中音频无法播放,使用python进行格式转换[附Timit 百度网盘下载地址]_ASR_THU的博客-CSDN博客


版权声明:本文为qq_43566612原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。