A API de fala do Google possui recursos de fala em áudio para texto em vários idiomas. Também suporta turco. Esse idioma é muito interessante, é chamado aglutinante : você cola partes das palavras uma após a outra, em vez de preposições e outras partes em idiomas como o inglês. Isso leva a um vocabulário de tamanho praticamente ilimitado.
Você sabe como o Google implementou o reconhecimento de fala turco para a API deles? Não acredito que eles usaram as mesmas técnicas do inglês.
ATUALIZAR
Aqui está um exemplo de transcrição que a API do Google retornou do seguinte clipe no YouTube:
você teria que perguntar a ele que eu não tenho idéia Yahoo respostas Eu era Adam Scott realmente em Jumanji no The Truman Show Eu o procurei no iTunes, dizendo que, nos filmes em que ela está, era Jumanji e The Truman Show eu não * * * * acredite que vai ouvir Eu não estou em nenhum desses filmes, então sim, você realmente não deveria * * * *
Eu acho que é uma excelente qualidade de transcrição. Usei meus belos monitores AudioEngine e coloquei um microfone de computador LabTec de 20 anos de idade ruim na frente dele. Uma configuração verdadeiramente amadora, mas é assim que essas coisas serão usadas na prática, ou seja, em situações abaixo da ideal.
Aqui está um exemplo de uma cena de filme turco :
merhaba Temmuz Ben tem carpas e keyifler nasylsınız iyidir inşallah İyi valla koşturuyoruz nasıl olsun Hem kardeş lafı uzatmadan konuya girsek anlattı bana ikinci el işçiliğiir işideyi dızel ilir
Este é basicamente incompreensível. Ele pega algumas palavras aqui e ali, mas é difícil conectá-las, como no exemplo em inglês.
Isso significa que o Google não está usando uma solução personalizada para turco? Talvez eles desejem redirecionar seus mecanismos de inglês para o turco?
Apenas por diversão, enviei um clipe do falante do idioma azeri . Seu discurso é claramente enunciado, mas a API mal conseguiu algumas palavras. Eu usei a configuração turca, então não é justo, realmente, mas os idiomas são semelhantes:
ou akşam Çağlayan Doruk sevgilin kim bu kim baktı Bülent Serttaş çok pis