-
Notifications
You must be signed in to change notification settings - Fork 12
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
关于libriTTS数据集 #4
Comments
你好,libriTTS我们是用的openslr上下载的数据集,关于预处理部分代码脚本和ming024/FastSpeech2也基本一致,你可以先判断下是哪一步出的问题导致文本和语音对不上。 以下是我重新处理的一些流程。 下载解压好LibriTTS数据集: 第一步:执行prepare_align.py,按照说话人目录获得文本、语音成对的lab标注和wav文件,可检查是否对应; 第二步:下载对齐文件TextGrid放到指定目录下,这里也可以检查下对齐结果是正常; 第三步:执行preprocess.py,获得train-clean-100/dev-clean/test-clean.txt等文件 以及 duration/pitch/energy/mel等数据。 |
而且我的音频是16K的,下载地址能提供给我一下吗,感谢 |
好的,多谢哈 |
您好,请问LibriTTS的对齐MFA文件从哪下载呢 |
Checking TextGrid path: data/training_data/preprocessed_data/LibriTTS/TextGrid/121/121_127105_000043_000003.TextGrid |
Processing Data ... 有没有大神解答一下这是什么原因,为什么在python3 prepare_align.py config/LibriTTS/preprocess.yaml的时候,他没有处理完全, |
大佬,我在网上openslr上面下载的libriTTS 的clean100数据集和你们处理好的不一样,文本和语音都对不上,是我下错了还是需要额外的处理呢?求解惑
The text was updated successfully, but these errors were encountered: