Quais documentos sobre o tratamento de erros em sistemas distribuídos você recomenda?
Quais documentos sobre o tratamento de erros em sistemas distribuídos você recomenda?
Respostas:
Você pode dar uma olhada nas obras que ganharam Tushar D. Chandra, Vassos Hadzilacos e Sam Toueg, o Prêmio Edsger W. Dijkstra em 2010 :
Estes documentos introduzem a noção de detectores de falha em um sistema distribuído em uma estrutura geral e precisa. Intuitivamente, eles tentaram estudar a quantidade mínima de informações de falha necessárias para resolver o consenso. Acontece que você não precisa de um detector de falhas perfeito para resolver o consenso. Mesmo detectores de falhas não confiáveis que satisfaçam certas condições mínimas serão suficientes para a tarefa. Esses documentos foram muito influentes sobre como lidar com falhas em sistemas distribuídos.
Que tipo de falhas no sistema? Você está procurando soluções para lidar com falhas bizantinas ou apenas o modelo clássico de parada de falhas? Soluções na presença de nós bizantinos em um sistema distribuído é o problema mais intrigante. O problema foi formalizado por Leslie Lamport (o problema dos generais bizantinos "e o artigo de 1999 de Barbara Liskov e Miguel Castro apresenta a solução prática mais prática" Tolerância a falhas bizantina prática ". Os modelos formais originais para lidar com a tolerância a falhas incluem o estado- abordagem de máquina de Fred Schneider e replicação com impressão de ponto de vista Eu concordo que a questão é muito geral, o campo é imenso e a teoria forma a base da maioria dos sistemas atualmente em execução online Talvez um modelo de falha mais específico e o domínio do problema ajudem a obter melhores respostas
Aqui está uma coleção de padrões para lidar com erros em sistemas distribuídos:
Como alternativa, para trabalhos mais genéricos, há o livro Introdução à Programação Distribuída Confiável, de Rachid Guerraoui e Luis Rodrigues, que possui uma vasta gama de algoritmos práticos, incluindo muitas variantes de recuperação de falhas. O texto mais clássico Algoritmos Distribuídos de Nancy Lynch cobre um terreno semelhante de uma perspectiva mais teórica.