Isso acontece ocasionalmente quando a Amazon está tentando descomissionar o servidor físico em que sua instância está sendo executada. Eles podem estar matando o servidor para substituir um componente de hardware com falha ou o servidor pode simplesmente ter atingido seu fim de vida. De qualquer maneira, pelo que entendi, o processo deles funciona mais ou menos assim:
- O servidor físico é marcado como descomissionado para que nenhuma nova instância seja iniciada nele.
- Se eles puderem (por exemplo, não estão lidando com uma falha crítica de hardware), a Amazon aguardará algum tempo para verificar se as instâncias em execução no servidor são encerradas ou reinicializadas por si mesmas (a reinicialização de uma instância do EC2 geralmente resulta em lançado em um servidor físico diferente).
- Após a conclusão desse período, a Amazon forçará as instâncias restantes a reiniciar, movendo-as para outros servidores físicos.
Como regra geral, devido a essa e outras peculiaridades no ambiente, você deve tratar qualquer servidor individual em execução no EC2 como Efêmero. Qualquer servidor pode reiniciar ou desaparecer a qualquer momento. Portanto, é essencial automatizar a implantação com algo como chef ou fantoche , ter monitoramento sólido e projetar seu aplicativo para solucionar falhas.