Uma técnica de processamento de sinal, o Mel frequency Cepstrum , é freqüentemente usada para extrair informações de uma peça musical para uso em tarefas de aprendizado de máquina. Este método fornece um espectro de potência de curto prazo, e os coeficientes são usados como entrada.
Ao projetar sistemas de recuperação de música, esses coeficientes são considerados característicos de uma peça (obviamente não necessariamente únicos, mas distintos). Existem características que melhor se adequariam ao aprendizado com uma rede? Características variáveis no tempo, como a progressão dos graves da peça usada em algo como uma rede Elman, funcionariam com mais eficiência?
Quais características formariam um conjunto suficientemente extenso sobre o qual a classificação poderia ocorrer?