Hoje, várias máquinas pararam de obter acesso à Internet. Após muita solução de problemas, o problema comum é que todos eles tiveram sua concessão dhcp renovada hoje (estamos com concessões de 8 dias aqui).
Tudo o que você esperaria parece bom após a renovação da concessão: eles têm um endereço IP, servidor DNS e gateway válidos. Eles têm acesso a recursos internos (compartilhamentos de arquivos, intranet, impressoras etc.). Um pouco mais de solução de problemas revela que eles não conseguem fazer ping ou rastrear para o nosso gateway, mas podem acessar nosso switch principal da camada3 logo em frente ao gateway. A atribuição de um IP estático à máquina funciona como uma solução temporária.
Uma desvantagem final é que até agora os relatórios chegaram apenas para clientes na mesma vlan que o gateway. Nossa equipe administrativa e o corpo docente estão na mesma vlan dos servidores e impressoras, mas os telefones, as chaves / câmeras, os alunos / wifi e os laboratórios têm suas próprias vlans e, até onde eu não vi nada em outras vlans ainda teve um problema.
Eu tenho um ingresso separado com o fornecedor do gateway, mas suspeito que eles aceitem o problema e me digam que o problema está em outra parte da rede, por isso estou perguntando aqui também. Limpei os caches ARP no gateway e no switch principal. Todas as idéias são bem-vindas.
Atualização:
tentei efetuar ping do gateway de volta para alguns hosts afetados, e o mais estranho é que recebi uma resposta: de um endereço IP completamente diferente. Eu tentei mais alguns aleatoriamente e, finalmente, consegui isso:
Sex 02 de setembro de 2011 13:08:51 GMT-0500 (horário de verão central) PING 10.1.1.97 (10.1.1.97) 56 (84) bytes de dados. 64 bytes de 10.1.1.105: icmp_seq = 1 ttl = 255 time = 1.35 ms 64 bytes de 10.1.1.97: icmp_seq = 1 ttl = 255 time = 39.9 ms (DUP!)
10.1.1.97 é o destino pretendido real do ping. 10.1.1.105 deveria ser uma impressora em outro prédio. Eu nunca vi um DUP em uma resposta de ping antes.
Meu melhor palpite no momento é um roteador Wi-Fi desonesto em um de nossos dormitórios na sub-rede 10.1.1.0/24 com um gateway ruim.
...contínuo. Agora desliguei a impressora incorreta e pings para um host afetado do gateway simplesmente falham completamente.
Atualização 2:
Verifico as tabelas arp em uma máquina afetada, no gateway e em todos os comutadores entre elas. Em cada ponto, as entradas para esses dispositivos estavam todas corretas. Não verifiquei todas as entradas da tabela, mas todas as entradas que poderiam impactar o tráfego entre o host e o gateway estavam corretas. ARP não é o problema.
Atualização 3:
As coisas estão funcionando no momento, mas não consigo ver nada que fiz para corrigi-las e, portanto, não tenho idéia se isso pode ser apenas uma pausa temporária. De qualquer forma, não há muito que eu possa fazer para diagnosticar ou solucionar problemas agora, mas atualizarei mais se ele quebrar novamente.