Skip to content

ClubCedille/point

Folders and files

NameName
Last commit message
Last commit date

Latest commit

3907273 · Jul 19, 2024

History

9 Commits
Jul 17, 2024
Jul 18, 2024
Jul 17, 2024
May 30, 2024
Jun 21, 2024
Jun 21, 2024
Jun 21, 2024
Jul 19, 2024
Jul 17, 2024

Repository files navigation

point

Transcription d'audio en texte grâce à Whisper.

Utilisation

point.py est un service qui répond aux requêtes POST au chemin /transcript avec le texte correspondant à la transcription du fichier audio donné.

À la première requête, si le modèle Whisper n'est pas présent, il sera téléchargé dans le dossier whisper-models du dossier courant.

Par exemple,

$ python3 point.py --port 5000

Et dans un autre terminal:

$ curl -X POST -T '12 Still Alive.mp3' -H 'Content-Type: audio/mp3' http://127.0.0.1:5000/transcript
2024-06-20 19:54:40, transcript with base

 This was a triumph.
 I'm making a note here, huge success.
 It's hard to always date my sad inspection.
...

Ce n'est pas parfait, mais si le modèle utilisé est plus gros que base (comme distil-large-v3), ça devrait mieux fonctionner. Le langage est détecté automatiquement.