Estou trabalhando em um projeto em Python para detectar e classificar alguns cantos de pássaros, e me encontrei em uma posição em que preciso converter um arquivo wave em dados de frequência versus tempo. Isso não tem sido um problema muito grande, mas para poder classificar as diferentes sílabas em grupos, preciso escrever algo que detecte quando os dados se agrupam em uma determinada forma. Para ter uma idéia da aparência dos dados, veja uma imagem de como os dados são exibidos quando plotados:
Eu preciso de alguma maneira de obter cada sílaba individual (cada forma com uma separação de cada lado) e salvá-las em uma variável ou em seus próprios arquivos, para que eu possa executar a correlação de Pearson entre eles usando o SciPy.
Além disso, prefiro o Python, mas estou aberto a codificar em outros idiomas, se você tiver outra maneira de fazê-lo.
Obrigado!