이 프로젝트는 캐릭터 기반 음성 합성(TTS)을 위해 YourTTS 모델을 기반으로 수정·학습한 프로젝트입니다.
짱구, 케로로, 코난 3명의 캐릭터 음성을 한 명의 화자로 두고 한국어를 학습시킨 후, 각각 단일 화자 전용 모델로 재학습하여 총 3개의 캐릭터 TTS 모델을 생성했습니다.
- 짱구, 케로로, 코난 음성 데이터를 동일 화자처럼 취급하여 한국어를 학습하도록 사전 학습합니다.
- 1단계 모델을 기반으로, 각 캐릭터별로 단일 화자 전용 모델을 파인튜닝하여 다음 3개 모델을 제작했습니다:
yourtts-jjangguyourtts-keroroyourtts-conan
아래의 ipnyb 파일을 따라가면 학습, 추론이 가능합니다. (코랩 유료환경 사용하였습니다.)
| 캐릭터 | 모델 링크 |
|---|---|
| 짱구 | yourtts-jjanggu |
| 케로로 | yourtts-keroro |
| 코난 | yourtts-conan |
( 사전학습한 모델 | yourtts-pretrained )