Como as empresas estão rastreando erros em dispositivos, gateways e plataformas de IoT atualmente? Minha empresa está usando o papertrail para agregar logs de todos os dispositivos; no entanto, isso geralmente nos deixa mexendo entre vários sistemas quando ocorre um erro na produção.
Estou procurando uma maneira de reduzir nosso "tempo até a causa raiz" ao resolver exceções que podem ter sido geradas em um único local (por exemplo, em uma plataforma IoT), mas que se originaram como resultado de um problema em outro lugar do pilha - por exemplo, erro de dados do dispositivo de borda.
Em termos do que encontrei neste espaço, o Sentry e o Rollbar são bons para rastrear exceções em servidores ou aplicativos, mas não fornecem um meio de rastrear erros em cascata, conforme discutido no parágrafo anterior.
Existem sistemas para fazer isso melhor do que o log de texto? Estou procurando especificamente usar os eventos de trilha de navegação que você recebe do Sentry, mas com o rastreamento em um sistema distribuído.