Eu trabalho em energia renovável. Minha empresa coleta muitos dados de equipamentos. Isso normalmente inclui dados do processo (como temperatura do transformador, tensões de linha, correntes, etc.) e alarmes discretos (por exemplo, disparo do disjuntor, valores de alarme do inversor, alarme de superaquecimento do transformador). Este é um exemplo aproximado da aparência de nossos dados (para serem lidos como linhas de csv):
- registro de data e hora, tag, valor
- 25/05/2016 14:30:01, INVERTER_1.VOLTAGE_DC, 249,5
- 25/05/2016 14:30:06, INVERTER_1.VOLTAGE_DC, 250,1
- 25/05/2016 14:45:02, TRANSFORMER_1.TEMP_ALARM, 0
- 25/05/2016 14:45:15, TRANSFORMER_1.TEMP_ALARM, 1
Gostaria de começar a realizar algumas análises de padrões nesses dados em repouso, não em tempo real (pelo menos por enquanto). Acredito que o que eu gostaria de tentar seja um aprendizado não supervisionado de recursos, mas não tenho certeza. Seria bom (eu acho) aplicar o aprendizado de máquina para 1) identificar quaisquer padrões que não sejam óbvios e 2) permitir que um algoritmo identifique assinaturas de padrões nos dados (por exemplo, todos os inversores em um único alimentador perdem a comunicação quando um disjuntor está aberto).
Minha pergunta inicial: são considerados dados de séries temporais? Em minha pesquisa até agora, parece que os dados de séries temporais referenciam dados que são uma função do tempo. Para a maioria dos meus dados, como especialista em domínio, não acredito que a definição de funções para meus dados seja útil para essa análise. Além disso, em minha pesquisa, parece que os dados de séries temporais se referem a valores com valor real e não são discretos.
Quaisquer comentários ou referências relevantes seriam úteis.