Eu tenho um problema de conectividade intermitente estranho acontecendo uma vez a cada duas semanas.
Primeiro minha configuração: estou executando um cluster de failover do HyperV com dois hosts físicos (node01 e node02). Os hosts estão executando o servidor Windows Server 2008 R2 HyperV (o gratuito) com o SP1. Nesses hosts, estou executando duas VMs, cada uma executando o Windows Server 2008 R2 Web Edition com SP1. Meu servidor de armazenamento é o Windows Storage Server 2008 conectado via iSCSI. Tanto os hosts quanto o servidor de armazenamento estão executando os drivers de rede mais recentes baixados diretamente do site da Intel.
Aqui está o problema: 99,99% do tempo, tudo funciona perfeitamente. Cerca de uma vez a cada duas ou três semanas, as VMs perdem simultaneamente a conectividade de rede, de entrada e de saída. Quando isso acontece,
- Não consigo fazer RDP em nenhuma VM.
- Eu posso RDP em qualquer host.
- Posso conectar-me a qualquer VM no Gerenciador de Cluster de Failover clicando com o botão direito do mouse no nó e selecionando 'Conectar-se à Máquina Virtual'
- Depois de me conectar à VM, conforme descrito no item 3 acima, não consigo acessar sites ou máquinas na LAN. Desabilitar e reativar a conexão de rede virtual dentro da VM não resolve o problema.
- Se eu mover a VM para um nó diferente, isso resolverá o problema (pelas próximas duas semanas).
- Se eu reiniciar o host e mover a VM de volta para ele, isso resolverá o problema (pelas próximas duas semanas).
- Quando isso acontece, o cluster de failover NÃO realiza failover automaticamente da VM.
- Não há entradas incomuns no log de eventos em nenhum dos hosts ou VMs.
Isso aconteceu cerca de 5 vezes com os mesmos sintomas descritos acima. Suspeito de um problema de driver ou hardware de rede, mas como já estou executando os drivers mais recentes, não sei o que fazer.
Este é realmente um arranhão de cabeça ... alguma idéia?
Atualizar
Encontrei um caso muito semelhante aqui: o Virutal Machine perde a conectividade de rede no Hyper V Cluster
Atualização 29/07/2011
Depois de instalar os hotfixes e atualizar os drivers de rede, ainda estou enfrentando o mesmo problema. Em resposta ao comentário solicitando detalhes do hardware, o servidor é um Intel SR1670HV, que é um chassi de 1U contendo duas placas-mãe S5500HV independentes. A comunicação é feita através das placas de rede integradas das placas-mãe, que são Intel 82574L. O driver de rede é a versão 16.2.49.0.