Respostas:
O que você precisa é de um software para "reconhecimento de fala". Há muitos disponíveis, mas esteja ciente de que os resultados geralmente precisam de muita correção. Os DVDs serão particularmente difíceis, porque eles têm vários alto-falantes diferentes, possivelmente muito ruído e pronúncia ruim / não-padrão. Então você só pode esperar um rascunho de uma transcrição, você ainda terá que fazer muito à mão.
No front técnico, você provavelmente terá que extrair o áudio do DVD (usando algum software ripper, por ex. mplayer
), em seguida, executá-lo através de um programa de reconhecimento de fala.
Dê uma olhada nas respostas em tags speech-recognition
e speech-to-text
no superusuário para o software que você poderia usar.
Se o conteúdo tiver legendas ocultas, elas serão traduzíveis de forma direta e confiável nos dados do DVD. No entanto, muitas vezes eles não são exatamente o que é dito, mas parafraseados para que possam ser lidos, quando o diálogo é rápido (e raramente, simplesmente errado).
Legendas podem sofrer da mesma paráfrase. Além disso, em DVDs, eles são implementados como sobreposições gráficas, portanto, você realmente precisa de algum tipo de OCR para convertê-los novamente em texto.
Esta não é uma tarefa na qual os computadores são excelentes. Você já pensou em usar turk mecânico ?
reconhecimento de fala preciso sem treinar o software é impossível ... para prompts conhecidos (como em um IVR) você pode fazer uma coisa de lógica difusa onde "soa como" x, y, z ou dizer de novo ... isso não é possível gerar transcrições / legendas para DVDs