O que você tem é uma sequência de eventos de acordo com o tempo, então não hesite em chamá-lo de Série Temporal!
O agrupamento em séries temporais tem 2 significados diferentes:
- Segmentação de séries temporais, ou seja, você deseja segmentar uma série temporal individual em diferentes intervalos de tempo, de acordo com as semelhanças internas.
- Agrupamento de séries temporais, ou seja, você possui várias séries temporais e deseja encontrar diferentes agrupamentos de acordo com as semelhanças entre eles.
Suponho que você queira dizer o segundo e aqui está a minha sugestão:
Você tem muitos veículos e muitas observações por veículo, ou seja, você tem muitos veículos. Então você tem várias matrizes (cada veículo é uma matriz) e cada matriz contém N linhas (Nr de observações) e T colunas (pontos no tempo). Uma sugestão poderia ser a aplicação do PCA em cada matriz para reduzir a dimensionalidade e a observação dos dados no espaço do PC e verificar se há relações significativas entre diferentes observações dentro de uma matriz (veículo) . Em seguida, é possível colocar cada observação de todos os veículos um no outro e criar uma matriz e aplicar PCA a isso para ver as relações de uma única observação entre diferentes veículos.
Se você não tem valores negativos Matrix Factorization é fortemente recomendado para redução dimensão dos dados do formulário matriz.
Outra sugestão pode ser colocar todas as matrizes umas sobre as outras e criar um tensor N x M x T, onde N é o número de veículos, M é o número de observações e T é a sequência de tempo e aplica a Decomposição do Tensor para ver as relações globalmente.
Uma abordagem muito agradável ao Cluster de séries temporais é mostrada neste documento, onde a implementação é silenciosa e direta.
Espero que tenha ajudado!
Boa sorte :)
EDITAR
Como você mencionou, você quer dizer segmentação de séries temporais, adiciono isso à resposta.
A segmentação de séries temporais é o único problema de agrupamento que tem uma verdade fundamental para a avaliação. De fato, você considera a distribuição geradora por trás das séries temporais e a analisa. Eu recomendo fortemente isso , isto , isto , isto , isto e isto, onde o seu problema é estudado de maneira abrangente. Especialmente o último e a tese de doutorado.
Boa sorte!