Reconhecimento de fala - MP3 para software de texto [fechado]


16

Estou procurando um programa independente de alto-falante (comercial ou gratuito) que me permita transcrever arquivos MP3 contendo gravações de voz (especialmente podcasts) em texto. Eu queria experimentar o Dragon Naturally Speaking, mas parece que ele apenas suporta a transcrição das minhas próprias gravações de fala. Então quais são as alternativas?


Comentário por Avi: Eu não acredito que isso é possível - independente do locutor
Ivo Flipse

qual sistema operacional?
studiohack

Windows ou Linux.
quer

Respostas:


7

O Dragon Naturally Speaking importará arquivos mp3 e tentará transcrevê-los. Prefere ajustar o reconhecimento de voz para o alto-falante individual, mas faz um bom trabalho sem sintonizar. Provavelmente funcionaria melhor se os alto-falantes do podcast soassem como Tom Brokaw.


2
Eu tentei o Dragon Naturally Speaking, mas fez um péssimo trabalho em podcasts com alto-falantes desconhecidos. Só funcionou razoavelmente bem com minha própria voz após o treinamento do programa.
pako

1
Também pode importar outros arquivos de áudio e transcrevê-los?
Larry Morries

4

Uma solução possível seria enviar o seu vídeo para o Youtube e experimentar as legendas automáticas que você pode ativar ... ainda não é muito preciso, mas você pode fazer o download do arquivo de legendas e editá-lo, se isso ajudar ... para questões de direitos autorais / pirataria da música, você pode tornar o vídeo privado em seu perfil, se isso for possível?


1
@studioback: esse método do YouTube é aplicado apenas ao próprio vídeo, não aos enviados por outros?
StackExchange for All

1
@ Tim: é para ambos, na verdade.
studiohack

1
@studiohack: para os vídeos enviados por outras pessoas, como fazer isso? Quero dizer, sem baixar e enviar como meus próprios vídeos?
StackExchange for All

1
Na maioria dos vídeos, há um ícone CC na parte inferior, clique nele e, em seguida, transcrição automática ...
studiohack


2

Eu alertaria contra a tentativa de Dragon Naturally Speaking - escrevi alguns scripts no meu iphone jailbroken para copiar / converter todos os arquivos de correio de voz do meu telefone para uma pasta no meu PC e solicitei o serviço de transcrição do Dragon Naturally Speaking.

O resultado da execução da transcrição em arquivos com alto-falantes diferentes foi absolutamente inutilizável. Eu tentei algumas das alternativas de código aberto, mas o reconhecimento de voz independente do alto-falante ainda parece limitado a dicionários muito pequenos.


1

Estou usando o http://www.voicebase.com com podcast e vídeos em inglês e funciona muito bem. É grátis por 50 horas de áudio.

Você pode baixar a transcrição de áudio em rtf, srt ou pdf.

Você pode fazer o download das transcrições da máquina cerca de 10 a 15 minutos após o upload e, às vezes, mais cedo.



Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.