Tôi thấy rằng dù dấu (. , ? !) đều có cùng thời gian ngắt nghỉ (khoảng im lặng) giống nhau hoàn toàn.
Nếu câu có dấu ? và ! và . thì đều có cùng cách đọc.
StyleTTS2 không nhận biết được cách đọc cho câu có dấu như dấu hỏi (?) và dấu chấm (.)
Tôi rất mong được giải đáp thắc mắc. Làm cách nào để tinh chỉnh cho dấu ngắt câu có khoảng im lặng khác nhau.
Dù audio và file txt train của tôi đã có các dấu câu và khoảng ngắt nghỉ đúng theo văn bản. Nhưng StyleTTS2 lite vi vẫn không phân biệt được dấu câu nào cần ngắt nghỉ dài hơn. ví dụ dấu chấm tôi đặt 0.45s và dấu phẩy là 0.25s và dấu chấm than là 0.4s và dấu hỏi là 0,45s . nhưng tôi nhận lại không như mong đợi.
Nếu tôi chạy cắt ngắn câu ra để tạo audio rồi chèn khoảng im lặng thì giống như tôi mong đợi. nhưng làm như vậy lại khiến tạo audio bị chậm đi rất nhiều.
cảm ơn bạn đã chia sẽ nghiên cứu và thành quả của bạn.
Tôi thấy rằng dù dấu (. , ? !) đều có cùng thời gian ngắt nghỉ (khoảng im lặng) giống nhau hoàn toàn.
Nếu câu có dấu ? và ! và . thì đều có cùng cách đọc.
StyleTTS2 không nhận biết được cách đọc cho câu có dấu như dấu hỏi (?) và dấu chấm (.)
Tôi rất mong được giải đáp thắc mắc. Làm cách nào để tinh chỉnh cho dấu ngắt câu có khoảng im lặng khác nhau.
Dù audio và file txt train của tôi đã có các dấu câu và khoảng ngắt nghỉ đúng theo văn bản. Nhưng StyleTTS2 lite vi vẫn không phân biệt được dấu câu nào cần ngắt nghỉ dài hơn. ví dụ dấu chấm tôi đặt 0.45s và dấu phẩy là 0.25s và dấu chấm than là 0.4s và dấu hỏi là 0,45s . nhưng tôi nhận lại không như mong đợi.
Nếu tôi chạy cắt ngắn câu ra để tạo audio rồi chèn khoảng im lặng thì giống như tôi mong đợi. nhưng làm như vậy lại khiến tạo audio bị chậm đi rất nhiều.
cảm ơn bạn đã chia sẽ nghiên cứu và thành quả của bạn.