이름	분야	주요 업무
김규리	Modeling	Object/Emotion Detection, Prompt Engineering
김나훈	Modeling/MLOps	Emotional TTS, 서비스 파이프라인 구축
김현우	Front/Back-end	프론트/백엔드 시스템 설계, 서비스 파이프라인 구축
심준석	Modeling	Prompt Engineering, Image Captioning
이하준	Modeling/Server	Image Captioning, 데이터 수집 및 처리

개발 기간 및 수행 절차

전체 개발 기간 : 2023-12-09 ~ 2024-01-24

프로젝트 사용 모델

Image Captiong & Prompt Enginerring
Emotional-TTS

시연 과정

1. 웹 페이지 접속	2. Emotion TTS로 변환할 이미지 업로드

3. 알림창이 뜨며 음원 생성 완료	4. 음원 스크립트 전문과 오디오 파일 다운로드

발표 자료

개선 목표

한국어 Emotional-TTS 구현
웹 페이지 기능 추가

프로젝트 후기

한정된 시간으로 웹 페이지에서 성우의 선택이나 발화 묘사 수준의 조절 등을 구현하지 못해 아쉬웠습니다. 또한, 한국어 감정 발화 데이터셋 및 한국어 Emotional-TTS 모델의 부재로 인해 영어 기반의 서비스를 개발하게 되었습니다. 따라서 향후 한국어 발화 데이터셋을 구축하고 이를 기반으로 한 학습이 진행된다면 국내 상용화 서비스를 제공할 수 있을 것으로 기대하고 있습니다.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

목차

프로젝트 소개

프로젝트 목표

팀원 구성

개발 환경

아키텍처 구조

역할 분담

개발 기간 및 수행 절차

프로젝트 사용 모델

시연 과정

발표 자료

개선 목표

프로젝트 후기

Files

README.md

Latest commit

History

README.md

File metadata and controls

목차

프로젝트 소개

프로젝트 목표

팀원 구성

개발 환경

아키텍처 구조

역할 분담

개발 기간 및 수행 절차

프로젝트 사용 모델

시연 과정

발표 자료

개선 목표

프로젝트 후기