Eu não consideraria a DTW desatualizada. Em 2006, Xi et al. mostrou que
[...] muitos algoritmos foram propostos para o problema de classificação de séries temporais. No entanto, é claro que a distância de um vizinho mais próximo com a DTW (Dynamic Time Warping) é excepcionalmente difícil de superar.
Os resultados deste artigo estão resumidos no livro "Mineração de Dados Temporais", de Theophano Mitsa, da seguinte forma:
- Em [Che05a], uma abordagem estática de minimização-maximização gera um erro máximo de 7,2%. Com 1NN-DTW, o erro é de 0,33% com o mesmo conjunto de dados que no artigo original.
- Em [Che05b], uma abordagem de histograma em várias escalas gera um erro máximo de 6%. Com 1NN-DTW, o erro (no mesmo conjunto de dados) é de 0,33%.
- Em [Ead05], um algoritmo de extração de recurso guiado por gramática gera um erro máximo de 13,22%. Com 1NN-DTW, o erro foi de 9,09%.
- Em [Hay05], as séries temporais são incorporadas em um espaço dimensional inferior usando um mapa próprio da Lapônia e distâncias de DTW. Os autores alcançaram uma precisão impressionante de 100%; no entanto, o 1NN-DTW também alcançou 100% de precisão.
- Em [Kim04], os modelos Hidden Markov alcançam 98% de precisão, enquanto o 1NN-DTW alcança 100% de precisão.
- Em [Nan01], uma rede neural perceptron de múltiplas camadas atinge o melhor desempenho de 1,9% de taxa de erro. No mesmo conjunto de dados, a taxa de 1NN-DTW foi de 0,33%.
- No [Rod00], a lógica de primeira ordem com aumento fornece uma taxa de erro de 3,6%. No mesmo conjunto de dados, a taxa de erro do 1NN-DTW foi de 0,33%.
- Em [Rod04], uma árvore de decisão baseada em DTW fornece uma taxa de erro de 4,9%. No mesmo conjunto de dados, 1NN-DTW fornece 0,0% de erro. • Em [Wu04], um conjunto de fusão de superkernel fornece uma taxa de erro de 0,79%, enquanto no mesmo conjunto de dados, 1NN-DTW fornece 0,33%.
Consulte o livro original para obter uma lista das referências mencionadas.
Uma coisa importante a se notar aqui é o fato de Xi et al. até consegui superar o desempenho de um MLP em 2006. Embora a situação possa parecer um pouco diferente hoje em dia (como temos melhores e mais rápidos algoritmos de aprendizado profundo em mãos), eu ainda consideraria a DTW uma opção válida para analisar quando trata-se de classificações de sinal.
Atualizar
Eu também gostaria de adicionar um link a um artigo mais recente chamado "A Grande Classificação de Séries Temporais: Uma Avaliação Experimental de Algoritmos Propostos Recentemente" a partir de 2016. Neste artigo, os autores "implementaram 18 algoritmos recentemente propostos de maneira comum. Framework Java e os comparou com dois classificadores de benchmark padrão (e entre si) ". As seguintes citações do artigo enfatizam que a DTW é (ou pelo menos era em 2016) de fato ainda relevante:
- De fato, muitos dos algoritmos não são melhores do que nossos dois classificadores de benchmark, 1-NN DTW e Rotation Forest.
- Para aqueles que desejam criar um modelo preditivo para um novo problema, recomendamos começar com DTW, RandF e RotF como uma verificação básica de sanidade e referência.
- A sabedoria recebida é que é difícil vencer o DTW.