Quais são os equivalentes de áudio de imagens como "Lena", "Mandrill" e "Cameraman"?


21

Não sei como chamar essas imagens, mas elas costumam ser usadas no mundo do processamento de imagens como exemplos padrão para mostrar a saída de uma operação específica. Aqui está um link para a página que descreve Lena como uma "imagem de teste padrão" . Existem clipes de áudio canônicos semelhantes usados ​​para demonstrar os efeitos de certos filtros ou operações de áudio?

Respostas:


17

O exemplo mais próximo que consigo pensar é o início do "Tom's Diner" de Suzanne Vega, que foi usado para o desenvolvimento da camada 3 do mpeg-1 e ainda é usado ocasionalmente para demonstrar codecs de áudio.


3
sim, o Tom's Diner é um trecho de voz de canto razoavelmente limpo (sem reverberação) e monofônico, útil para testar programas de detecção de afinação. outro é um clipe do Boyz II Men na capa de "Ontem" dos Beatles (logo no final). bom para rastreamento de pitch de um vocal monofônico. é mais difícil que o Tom's Diner. Lembro que o Digital Performer o usou.
Robert Bristow-johnson

16

O processamento de áudio é um campo amplo, mas especificamente no processamento de fala, um banco de dados aberto de amostras conhecido como Harvard Sentences é amplamente utilizado. As frases de Harvard são coleções de frases foneticamente equilibradas no inglês americano. Muitos bancos de dados equivalentes existem para outros idiomas também.

Os arquivos reais com discursos de Harvard Sentences podem ser encontrados aqui .


5

Eu também acho que o banco de dados NIST é muito popular quando se trata de tarefas de reconhecimento de fala. De fato, é um padrão para comparação de novos algoritmos e técnicas durante os desafios anuais.

Além disso, o load handelsnippet contendo GFHandel - Aleluia do MATLAB é bastante usado.



2

Não subestime a potência da onda senoidal de 1 kHz a 0 dBFS. Em mono. Muitas coisas erradas nos caminhos de sinal podem ser encontradas com isso.

Eu construí e calibrei sistemas de áudio suficientes para que eu assobiasse exatamente 1 kHz. Da memória simples.

Fora isso, o IGY de Donald Fagen é tão popular como pista de teste que foi proibido por vários festivais.

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.