No meu tempo livre, estou trabalhando em um pequeno sistema baseado na Web que coleta relatórios de falhas (mas não outros relatórios de erros sem falhas) que são enviados a partir de aplicativos Delphi para Windows.
Para solução de problemas, os usuários gostariam de ter um recurso de mineração de dados para encontrar relacionamentos entre as versões de hardware ou sistema operacional e o bug e / ou falha específicos.
Como um exemplo de como isso deve funcionar:
- para cada falha, há um relatório no banco de dados, que possui um código de impressão digital / hash do rastreamento da pilha (pilha de chamadas) no momento da falha para identificar duplicatas
- o algoritmo verifica se todas as duplicatas de um relatório de erro também têm outros atributos comuns, por exemplo, um service pack ausente do sistema operacional
- o resultado da análise lista todas as propriedades que os relatórios de erros têm em comum
Vamos supor que esses relatórios automáticos de erros contenham todas as informações importantes, como os nomes de todos os processos em execução no momento, nomes de arquivos, informações de versão de DLLs carregadas etc.
Como posso encontrar correlações entre falhas repetidas e o ambiente? Existem algoritmos específicos ou métodos estatísticos que ajudariam?