Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Atualização #1

Open
mcferdev opened this issue Jul 1, 2020 · 3 comments
Open

Atualização #1

mcferdev opened this issue Jul 1, 2020 · 3 comments

Comments

@mcferdev
Copy link

mcferdev commented Jul 1, 2020

Bom dia,

Teve algum teste mais recente ? Em minha empresa possuimos um sistema baseado no BigBlueButton pra video conferencia e agora queremos transcrever os audios. Estamos em busca de alguma solução ASR que rode em nosso servidor. Comecei a buscar e caí aqui em seu trabalho. Pelo visto comparou as API´s (2017). Alguma dica que possa me dar ?

Obrigado

@jcsilva
Copy link
Owner

jcsilva commented Jul 1, 2020

Oi Marcelo,

não refiz estes testes depois de 2017, então eu não sei como está o atual desempenho desses sistemas de reconhecimento de fala. De toda forma, se você estiver interessado em uma solução comercial, sugiro dar uma olhada no ASR do CPqD. Eu trabalhei um tempo com o pessoal de lá e sei que o sistema funciona muito bem para diversas aplicações e talvez seja adequado para a sua também. Se tiver interesse, me diga e posso tentar encontrar algum contato lá.

Agora, se você estiver interessado em criar o seu sistema de reconhecimento de fala, aí já é uma outra história ...

Até

@mcferdev
Copy link
Author

Obrigado pela resposta.
Então...a ideia aqui é usar um pago inicialmente e em paralelo criar o próprio. Não entendo de IA e comecei a pesquisar recentemente. O nosso cenário é bem atípico. Aqui iriam ser gravadas algumas audiências/interrogatórios e seriam transcritos os áudios. O problema são os diferentes sotaques e gírias. Eu fiz um teste com o Google Transcript, que aparentemente é o mais avançado, e em um cenário de audio limpo, palavras normais e vocabulário padrão, ele se sai bem, mas no nosso cenário tem muita dificuldade, mas é melhor do que nada.

Essa solução que falou, do CPqD, seria legal eu ter uma conversa com eles. Se puder resgatar algum contato, seria otimo.

Obrigado.

@jcsilva
Copy link
Owner

jcsilva commented Jul 16, 2020

Oi,

você pode me indicar um e-mail para te colocar em contato com o pessoal da CPqD?

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants