Skip to content

Latest commit

Β 

History

History
70 lines (54 loc) Β· 2.01 KB

File metadata and controls

70 lines (54 loc) Β· 2.01 KB

ν…ŒμŠ€νŠΈ κ°€μ΄λ“œ

1. ν™˜κ²½ μ„€μ •

νŒ¨ν‚€μ§€ μ„€μΉ˜

pip install -r requirements.txt

ν™˜κ²½ λ³€μˆ˜ μ„€μ •

  1. .env.example νŒŒμΌμ„ .env둜 볡사
  2. Google Gemini API ν‚€ λ°œκΈ‰: https://makersuite.google.com/app/apikey
  3. .env νŒŒμΌμ— API ν‚€ μž…λ ₯:
    GOOGLE_API_KEY=λ°œκΈ‰λ°›μ€_API_ν‚€
    

2. ν…ŒμŠ€νŠΈ μ˜μƒ μ€€λΉ„

ν•„μš”ν•œ μ˜μƒ 파일:

  • ν˜•μ‹: .mp4 파일
  • λ‚΄μš©: μž…λͺ¨μ–‘이 잘 λ³΄μ΄λŠ” μ–Όκ΅΄ μ˜μƒ
  • μš”κ΅¬μ‚¬ν•­:
    • 얼꡴이 정면을 ν–₯ν•˜κ³  μžˆμ–΄μ•Ό 함
    • μž…μ΄ λͺ…ν™•ν•˜κ²Œ 보여야 함
    • MediaPipeκ°€ 얼꡴을 인식할 수 μžˆμ–΄μ•Ό 함

μ˜μƒ μ—…λ‘œλ“œ μœ„μΉ˜:

  • Gradio μ›Ή μΈν„°νŽ˜μ΄μŠ€ μ‚¬μš© μ‹œ: μ›Ή νŽ˜μ΄μ§€μ—μ„œ 직접 μ—…λ‘œλ“œ
  • ν”„λ‘œκ·Έλž¨ μ‹€ν–‰ μ‹œ: AI_BE 폴더 λ‚΄ 아무 κ³³μ—λ‚˜ μ €μž₯ (ν”„λ‘œκ·Έλž¨μ΄ μžλ™μœΌλ‘œ uploaded_videos/ ν΄λ”λ‘œ 볡사)

3. μ‹€ν–‰ 방법

μ• ν”Œλ¦¬μΌ€μ΄μ…˜ μ‹€ν–‰

cd AI_BE
python ai_setence_tts_app.py

μ‹€ν–‰ ν›„ 터미널에 ν‘œμ‹œλ˜λŠ” URL (예: http://127.0.0.1:7860)둜 접속

μ›Ή μΈν„°νŽ˜μ΄μŠ€ μ‚¬μš©

  1. λΈŒλΌμš°μ €μ—μ„œ URL 접속
  2. "μž…λͺ¨μ–‘ μ˜μƒ μ—…λ‘œλ“œ(.mp4)" μ„Ήμ…˜μ— μ˜μƒ 파일 μ—…λ‘œλ“œ
  3. "λ³΅μ›ν•˜κΈ°" λ²„νŠΌ 클릭
  4. κ²°κ³Ό 확인:
    • 예츑된 μ˜λ„: JSON ν˜•μ‹μ˜ μ˜λ„ νƒœκ·Έλ“€
    • λ³΅μ›λœ λ¬Έμž₯: Geminiκ°€ μƒμ„±ν•œ μžμ—°μ–΄ λ¬Έμž₯
    • μƒμ„±λœ μŒμ„±: TTS둜 μƒμ„±λœ MP3 파일

4. μƒμ„±λ˜λŠ” νŒŒμΌλ“€

ν”„λ‘œκ·Έλž¨ μ‹€ν–‰ μ‹œ μžλ™μœΌλ‘œ μƒμ„±λ˜λŠ” 폴더:

  • uploaded_videos/: μ—…λ‘œλ“œλœ 원본 μ˜μƒ
  • tmp_video/: μ „μ²˜λ¦¬λœ μž… μ˜μ—­λ§Œ crop된 μ˜μƒ
  • tmp_npy/: λͺ¨λΈ μž…λ ₯용 numpy λ°°μ—΄ 파일
  • tts_outputs/: μƒμ„±λœ TTS μ˜€λ””μ˜€ 파일

5. 문제 ν•΄κ²°

μž… 인식 μ‹€νŒ¨

  • 얼꡴이 정면을 ν–₯ν•˜κ³  μžˆλŠ”μ§€ 확인
  • μ‘°λͺ…이 μΆ©λΆ„ν•œμ§€ 확인
  • μ˜μƒ ν’ˆμ§ˆ 확인

API ν‚€ 였λ₯˜

  • .env 파일이 μ˜¬λ°”λ₯Έ μœ„μΉ˜μ— μžˆλŠ”μ§€ 확인
  • API ν‚€κ°€ μ˜¬λ°”λ₯΄κ²Œ μž…λ ₯λ˜μ—ˆλŠ”μ§€ 확인
  • Gemini API ν• λ‹ΉλŸ‰ 확인