Servidor Dell PowerEdge caiu, como reparar? O que aconteceu? Informações dentro


8

Atualmente, estou no ensino médio e administro o site da nossa escola. Neste verão, o nosso SysAdmin foi diagnosticado com câncer e ele partiu para o tratamento, então fui jogado em uma situação interessante.

Realmente não tenho certeza do que há de errado com este servidor da Web, mas adoraria suas idéias / ensino / sugestões, pois estou tentando aprender rapidamente para poder ajudar.

O servidor executou / está executando o FreeBSD, o que pode não significar nada, pois se trata de um problema de hardware. Eu sei que em um ponto o servidor tinha cinco unidades idênticas (isso significa Raid-5?), Mas no momento do travamento havia três unidades em funcionamento ("executando no modo degradado?").

Cerca de uma semana atrás, o servidor não foi iniciado porque encontrou apenas 1 unidade lógica. Eu executei o utilitário de configuração e vi o seguinte:http://i.stack.imgur.com/IL6ut.jpg

Suponho que ainda restariam alguns dados naquela unidade viva, certo? (Eu tenho backups dos arquivos da web, apenas não a configuração real do sistema operacional e do servidor da web).

Se houver alguma informação que eu precise adicionar para que você possa explicar melhor o que aconteceu comigo, estou mais do que disposto a fazer isso. Eu só estou olhando para entender o que aconteceu, o que foi em um ponto e como posso tomar medidas para corrigir isso.

Muito obrigado.


2
Tão triste :( minhas condolências ... Verifique os cabos de dados e energia em todas as unidades, backplane e controlador, reinsira os discos. Se possível, conecte essas unidades a outro computador (NÃO FORMATO), verifique se são reconhecidas.
GioMac

Oh, é SCSI, não é fácil de conectar a outro sistema :( provavelmente unidades são muito velho e morto.
GioMac

Se tudo isso não ajudar e se vale a pena - você pode tentar entrar em contato com a empresa que fornece serviços de recuperação de HDD.
GioMac

2
Sua rota para o sysadmin é muito semelhante à minha. Boa sorte para o futuro, fica melhor. Infelizmente, seus primeiros dias serão bastante desagradáveis, pois você precisará substituir todas as unidades deste servidor (adicionando outra como hot spare) e restaurar a partir do backup.
Tom O'Connor

Respostas:


12

Primeiro, minhas condolências pela hospitalização de seu mentor e seu batismo de fogo na administração do sistema.

Segundo, minhas condolências por sua perda de dados. Eu sinceramente espero que você tenha backups.


Para resumir sua situação:

Você possui uma matriz RAID de três unidades (presumivelmente um RAID-5 ).
Este é um "Logical Drive" (os três discos são manipulados pelo controlador RAID e apresentados ao restante do sistema como se fossem um drive).

Você perdeu duas das três unidades na matriz e o RAID-5 simplesmente não pode tolerar a falha de duas unidades. (Veja a postagem à qual vinculei anteriormente para obter mais informações.)

Para todos os efeitos, seus dados não são recuperáveis ​​- a única maneira de recuperar dados deste sistema seria enviar as três unidades para uma empresa de recuperação de dados (uma perspectiva dispendiosa).

Se você tiver backups, poderá iniciar o processo de reconstrução do sistema em novos discos.
Bons backups devem tornar o processo de restauração relativamente simples (embora, dependendo do sistema e do que mais ele esteja fazendo (email, DNS etc.), isso ainda possa ser um projeto).

Se você não possui backups, esperamos ter pelo menos uma cópia do site (na estação de trabalho em que você desenvolve?) E pode configurar um novo ambiente de servidor e fazer upload do site, ou, em alternativa, alugar algum espaço compartilhado na Web em pelo menos, volte a funcionar a presença na web da sua escola.

Se você tem experiência limitada em administração do sistema e ninguém trabalha com você, recomendo a rota de hospedagem compartilhada.


Mike, você sabe qual controlador é esse? é recuperável / compatível com dmraid?
GioMac 30/08/2013

6
Não estou dizendo que funcionará aqui, mas se você soubesse qual unidade falhou por último , se o utilitário de configuração permitir forçá-la a definir "Online", você poderá inicializá-la o suficiente para fazer um bom backup. Às vezes, as unidades são marcadas como "Falha" por um controlador, mas ainda não foram completamente concluídas por Fubar.
TheCleaner

1
O @TheCleaner tem razão - os controladores Dell PERC são especialmente notáveis ​​por isso - eles controlam off-line constantemente por erros de software. A chave é re-habilitar aquela que falhou LAST: Entendi errado e coisas ruins acontecem ...
voretaq7
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.