Utilisation d'une instance de PocketSphinx sur serveur distant #9

alexylem · 2016-06-23T17:40:02Z

Proposé par Physicien:
Pour finir, en jouant un peu dans les settings de Jarvis sur ma RP3, je me suis demandé s'il est envisageable d'ajouter une 4e option au choix de STT engine, soit l'option de faire appel à un serveur pocketsphinx sur un PC de l'utilisateur. Je lance l'idée, car ça revient à utiliser un serveur comme celui de Google ou de Wit(Facebook), mais sans les problèmes de respect de la vie privée.

physicien · 2016-06-23T19:47:28Z

C'est plutôt un détail que je veux apporter pour le moment, mais les modèles et dictionaires les plus à jour sont ceux directement accessible sur le site du LIUM. Dans précédemment, nous avons essayé avec les anciens modèles du LIUM de 62000 mots, alors que les nouveaux en contiennent environ 70000 mots. Tant qu'à utiliser un serveur avec un bon PC, autant avoir les meilleurs modèles disponibles!

physicien · 2016-06-27T22:04:14Z

Ça doit être bon signe ça!

alexylem · 2016-06-27T22:08:19Z

C'est quoi exactement? un instance de pocketsphinx sur un autre serveur?

physicien · 2016-06-27T22:13:46Z

C'est pocketsphinx sur Debian avec le français comme langue.

alexylem · 2016-06-27T22:16:04Z

ok et ca donne quoi niveau performances en reconnaissance continue?
Ca serait bien que tu indiques les specs de la bécane à côté du résultat 😄

physicien · 2016-06-27T22:20:00Z

Là je suis en train d'essayer de lui link mon micro de Webcam avec -adcdev plughw:0,0 -inmic yes et je dois simplement trouver comment. Pour les specs du PC, c'est certain que je vais mettre ça à côté!

alexylem · 2016-06-27T22:32:43Z

Ok bon déjà tu as la bonne commande, j'ai réussi à le faire marcher avec la même, voir #7

physicien · 2016-06-27T22:38:47Z

Au pire je vais test avec un .wav vu que c'est ce qu'on va lui passer à distance de toute façon.

physicien · 2016-06-27T22:49:03Z

J'ai envoyé un .wav et voici l'output. J'ai visiblement un setting qui n'est pas bon, je vais donc lire attentivement l'output!
output.txt

alexylem · 2016-06-27T22:51:25Z

la traduction extraite de ton fichier:

000000000: the moon
141567 last
000000001: we are as a hand on

J'ai regardé la config il semble que tu n'ai pas de `-lm

-lextreedump    0       0
-lifter     0       0
-lm             
-lmctl              
-lmname     default     default

Commence par ca 😄

physicien · 2016-06-27T22:53:05Z

J'ai utilisé un .lm.bin.

alexylem · 2016-06-27T22:54:09Z

Ok mais il n'est pas passé en paramètre car dans le header de config c'est vide.
Essayes:

pocketsphinx_continuous -lm ton_language_model.lm.bin ...

physicien · 2016-06-27T22:55:21Z

Voici le résultat...

physicien · 2016-06-27T22:57:51Z

Ok, je crois que c'est la version Debian de PocketSphinx qui est outdated... Je vais essayer d'arranger ça.

physicien · 2016-06-27T23:21:58Z

Bon, j'ai réussi à patenter quelque chose, mais il parle français. Il dit n'importe quoi, mais en français et très rapidement.

alexylem · 2016-07-30T16:47:01Z

Je pense commencer à me pencher la dessus, j'aimerai avoir une approche suffisamment générique. L'idée est de proposer un stt remote qui puisse convenir à une instance de PocketSphinx, mais aussi pourquoi pas Kaldi ou d'autre moteur de reconnaissance vocale sur machine distante.
Ainsi cela couvrira l'implémentation de #25 .

L'appel sera une requête POST http, donc il faudra qu'un serveur web (apache, nginx, python...) tourne sur la machine distante. L'URL complète sera configurable (host/IP + path + variables). Le retour par contre devra être du json, on pourra aussi paramétrer l'attribut à lire.

remote stt settings:
  host_url: "http://192.168.1.10/pocketsphinxweb?action=recognize"
  attribute_name: "transcript"

request:
  curl -X POST "http://192.168.1.10/pocketsphinxweb?action=recognize" \
       -H "Content-Type: audio/wav; samplerate=16000" \
       --data-binary "@$audiofile"

response:
  {transcript:"ca marche", confidence:1234}

physicien · 2016-07-30T17:26:08Z

Si je me souviens bien, la dernière fois que j'ai travaillé avec Kaldi, je pouvais lui donner un .wav et il essayait de l'écrire en anglais. J'en étais rendu à l'entraîner pour comprendre le français. L'entraînement en tant que tel n'est pas difficile à réaliser. Ce qui est un peu plus difficile, c'est la préparation des données.

En effet, afin de l'entraîner, il faut préparer de petits extraits audio ainsi que la retranscription de ce qui y est dit. Étant donné que nous voulons une grande variété de voix et un vocabulaire développé, les meilleurs données disponibles sont les livres audio de LibriVox. Cette méthode a déjà été appliqué pour l'anglais, donnant ainsi LibriSpeech.

La difficulté de la préparation des données réside dans la segmentation des fichiers audios et l'alignement du texte sur ces fichiers audio. Un article décrit la technique utilisée pour LibriSpeech.

alexylem · 2016-07-30T17:27:35Z

Ok @physicien , sinon un commentaire sur l'approche générique d'implémentation choisie? (voir mon post juste au dessus).

physicien · 2016-07-30T17:31:12Z

@alexylem C'était globalement comme ça que je voyais l'implémentation de mon côté. Envoyer un .wav à transcrire et retourner la transcription. Je ne peux que donner mon appui 👍

physicien · 2016-08-04T17:23:13Z

Je viens de tomber sur un lien qui détaille globalement ce que nous voulons faire, avec des commentaires sur les difficultés rencontrées, les solutions trouvées et les performances globales.

alexylem · 2016-08-05T19:21:17Z

Super ca va nous aider. J'en ai profité pour laissé un commentaire sur leur site car ils ont "oublié" de mentionner le projet Jarvis 😄

alexylem · 2016-09-13T18:35:32Z

Je pense proposer dans un premier temps un "template" de STT de manière à faciliter la création de nouveau moteurs de reconnaissance vocale (ou connecteur comme ici) par la communauté.

Oliv4945 · 2017-04-18T21:42:10Z

Salut,

Je bute sur l'installation de pocketsphinx_continuous sur Respeaker, mais je toute façon j'ai un doute sur le fait que ça tourne correctement. Donc la solution "serveur distant" me plait bien, avez vous avancé dessus ? Merci !

alexylem · 2017-04-19T07:46:00Z

Non mais je peux fournir un template très rapidement.
Tu aimerais faire tourner pocketsphinx sur un serveur distant? Pour la reconnaissance des commandes j'imagine? En français?

Oliv4945 · 2017-04-23T10:12:05Z

@alexylem : tout juste !
Je suis entrain de regarder pour utiliser le script Python de détection de hotword fourni par Seeedstudio, mais je pense que la reconnaissance des commandes gagnerai à être faite sur une machine plus pêchue, même si Bing fonctionne bien pour l'instant

alexylem · 2017-04-23T11:49:11Z

@Oliv4945 ok je te laisse t'occuper de la partie serveur et je m'occupe de l'intégration à Jarvis.
Que proposes-tu pour la communication?

Serveur web (RestAPI)
SSH
Autre?

Oliv4945 · 2017-04-23T16:38:37Z

Ce que tu décris ici me paraît plutôt bien, reste à voir d'un point de vue sécurité mais on peut s'en sortir avec une règle iptables.
Du coup je peux faire le serveur, mais pas tout de suite, j'aimerai avancer l'application Android et la publier, puis faire fonctionner les hotword respeaker.

alexylem · 2017-04-23T17:11:39Z

@Oliv4945 ok ça marche!

domotic-fr · 2017-11-15T13:24:32Z

Bonjour,

Peut-on envisager d'avoir PocketSphinx (ou autre) installé chez framasoft.org ?
On pourrai avoir la puissance d'une grosse machine avec le respect de la vie privée, à voir avec eux évidement.

Oliv4945 · 2017-11-15T17:30:35Z

à voir avec eux évidement.

Bonsoir @domotic-29 , je pense que tu as effectivement trouvé le premier pas à faire :)

domotic-fr · 2017-12-03T11:02:59Z

Bonjour,

En faite, je pense qu'il faut d'abord faire fonctionner le truc (Jarvis sur PI + PocketSphinx sur un serveur) avant de demander à installer chez Framasoft. De toute façon s'ils refusent la solution restera possible à domicile.
J'ai donc essayé, mais PocketSphinx évolue et en voulant faire une l'installation rapide il ne reconnait pas le texte dicté. Certains fichiers ont changé, par exemple le fichier lium_french_f0.tar.gz ne semble plus utilisé. Je vais devoir mieux lire la documentation, mais je voulais savoir si vous aviez avancé, et peut-être un lien vers des instructions d'installations récentes ?

baloss · 2019-08-08T15:58:30Z

Bonjour,
Tout d'abord je tiens à vous féliciter pour le projet Jarvis que j'ai découvert récemment et que je trouve super.
J’ai effectué mon installation avec Snowboy (pour la détection du mot clé) et Wit (pour la reconnaissance des commandes). Ca marche assez bien mais j’aimerais m’orienter vers une installation “full offline” et je voudrai avoir si l’utilisation d'une instance de PocketSphinx sur serveur distant est aujourd’hui possible.

alexylem added the enhancement label Jun 23, 2016

alexylem self-assigned this Jun 23, 2016

alexylem mentioned this issue Jun 23, 2016

Reconnaissance Vocale en Francais avec PocketSphinx #7

Closed

alexylem mentioned this issue Jul 7, 2016

Utilisation de la reconnaissance vocal [POST EXISTANT] sorry #36

Closed

physicien mentioned this issue Jul 19, 2016

PocketSphinx ne fonctionne pour avec la reconnaissance des commandes #57

Closed

alexylem mentioned this issue Jul 30, 2016

STT à distance avec Kaldi #25

Closed

alexylem added this to the Je travaille dessus milestone Jul 30, 2016

physicien mentioned this issue Sep 8, 2016

Speaker Recognition #109

Open

alexylem added this to the Prochainement milestone Sep 13, 2016

alexylem removed this from the Je travaille dessus milestone Sep 13, 2016

physicien self-assigned this Oct 12, 2016

alexylem mentioned this issue Jan 12, 2017

Use .gitkeep to keey config folder instead of empty #355

Merged

wikijm added the needanswerfromissueauthor label Apr 19, 2017

wikijm added the core request label Jul 7, 2017

wikijm unassigned physicien Jul 7, 2017

wikijm removed the needanswerfromissueauthor label Jul 7, 2017

Oliv4945 mentioned this issue Nov 8, 2017

Pocket Sphinx décentralisé #742

Closed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Utilisation d'une instance de PocketSphinx sur serveur distant #9

Utilisation d'une instance de PocketSphinx sur serveur distant #9

alexylem commented Jun 23, 2016

physicien commented Jun 23, 2016

physicien commented Jun 27, 2016

alexylem commented Jun 27, 2016

physicien commented Jun 27, 2016 •

edited

Loading

alexylem commented Jun 27, 2016

physicien commented Jun 27, 2016

alexylem commented Jun 27, 2016

physicien commented Jun 27, 2016

physicien commented Jun 27, 2016

alexylem commented Jun 27, 2016

physicien commented Jun 27, 2016

alexylem commented Jun 27, 2016

physicien commented Jun 27, 2016

physicien commented Jun 27, 2016

physicien commented Jun 27, 2016

alexylem commented Jul 30, 2016 •

edited

Loading

physicien commented Jul 30, 2016

alexylem commented Jul 30, 2016

physicien commented Jul 30, 2016

physicien commented Aug 4, 2016

alexylem commented Aug 5, 2016

alexylem commented Sep 13, 2016

Oliv4945 commented Apr 18, 2017

alexylem commented Apr 19, 2017

Oliv4945 commented Apr 23, 2017

alexylem commented Apr 23, 2017

Oliv4945 commented Apr 23, 2017

alexylem commented Apr 23, 2017

domotic-fr commented Nov 15, 2017 •

edited

Loading

Oliv4945 commented Nov 15, 2017

domotic-fr commented Dec 3, 2017

baloss commented Aug 8, 2019 •

edited

Loading

Utilisation d'une instance de PocketSphinx sur serveur distant #9

Utilisation d'une instance de PocketSphinx sur serveur distant #9

Comments

alexylem commented Jun 23, 2016

physicien commented Jun 23, 2016

physicien commented Jun 27, 2016

alexylem commented Jun 27, 2016

physicien commented Jun 27, 2016 • edited Loading

alexylem commented Jun 27, 2016

physicien commented Jun 27, 2016

alexylem commented Jun 27, 2016

physicien commented Jun 27, 2016

physicien commented Jun 27, 2016

alexylem commented Jun 27, 2016

physicien commented Jun 27, 2016

alexylem commented Jun 27, 2016

physicien commented Jun 27, 2016

physicien commented Jun 27, 2016

physicien commented Jun 27, 2016

alexylem commented Jul 30, 2016 • edited Loading

physicien commented Jul 30, 2016

alexylem commented Jul 30, 2016

physicien commented Jul 30, 2016

physicien commented Aug 4, 2016

alexylem commented Aug 5, 2016

alexylem commented Sep 13, 2016

Oliv4945 commented Apr 18, 2017

alexylem commented Apr 19, 2017

Oliv4945 commented Apr 23, 2017

alexylem commented Apr 23, 2017

Oliv4945 commented Apr 23, 2017

alexylem commented Apr 23, 2017

domotic-fr commented Nov 15, 2017 • edited Loading

Oliv4945 commented Nov 15, 2017

domotic-fr commented Dec 3, 2017

baloss commented Aug 8, 2019 • edited Loading

physicien commented Jun 27, 2016 •

edited

Loading

alexylem commented Jul 30, 2016 •

edited

Loading

domotic-fr commented Nov 15, 2017 •

edited

Loading

baloss commented Aug 8, 2019 •

edited

Loading