Temos uma caixa EMC NX4 SAN que serve um compartilhamento CIFS para vários servidores de aplicativos do Windows Server 2008 R2. Os servidores de aplicativos estão usando o compartilhamento CIFS para veicular muitos arquivos de imagem (~ 2500 ops / s no compartilhamento); no entanto, nem a SAN nem os servidores de aplicativos estão mostrando sinais óbvios de estresse.
De vez em quando, aparentemente, de repente, um servidor de aplicativos interrompe a conexão com a SAN. Qualquer código .NET que tenta servir um arquivo da SAN falha com:
System.IO.IOException: The specified network name is no longer available
Se eu fizer o RDP no servidor de aplicativos e tentar acessar "\ san-name" através do explorer, recebo o mesmo erro. Todos os outros servidores de aplicativos podem acessá-lo perfeitamente. Também posso acessar "\ ip-of-san" perfeitamente, o ping também funciona.
Uma reinicialização do servidor de aplicativos corrige o problema, mas é uma medida um tanto drástica para o problema, pois parece que a SAN está funcionando bem e o computador pode acessá-lo - apenas parece que o acesso "\ san-name" vomitou.
Isso aconteceu com dois servidores de aplicativos diferentes durante a última semana, então não suspeito que um único servidor de aplicativos seja a causa. Ignorando a causa por enquanto - como eu restauraria a conexão "\ san-name" sem reiniciar a máquina? E posso, de alguma forma, consultar o que deu errado?
Os logs de eventos não mostram nada (além dos erros relacionados ao ASP.NET causados pelo problema), nem nos servidores de aplicativos nem na SAN.
Atualização: com
base nas sugestões, tentarei reiniciar o serviço Estação de Trabalho na próxima vez e ver se isso ajuda no problema. Definitivamente, não é uma correção, mas é muito mais rápido do que reiniciar toda a máquina, como eu venho fazendo atualmente. Alguma maneira de consultar o status das conexões que o serviço Estação de Trabalho mantém?
Atualização 2:
Confirmado que reiniciar o serviço Estação de Trabalho "corrige" o problema. O próximo passo é tentar a alteração reg para aumentar o valor MaxCmds. Não será possível confirmar se esse é o problema; só podemos assumir se ele for executado por um longo período sem problemas.