Estou executando o Debian 7.2 em um antigo Macbook Pro de final de 2006. Eu tenho dois discos rígidos Seagate Backup Plus de 4 TB conectados a ele que tenho em um pool espelhado do ZFS. Recentemente, uma das unidades morreu e recebi uma unidade de substituição que estou tentando adicionar como um novo espelho. No entanto, não consigo resilver, pois um erro inevitavelmente acontece antes que ele termine.
O problema é que essa unidade de substituição aparentemente se desconecta e se reconecta em uma fração de segundo. O que eu descobri são as seguintes mensagens impressas no log do sistema repetidamente:
Jan 19 20:08:07 thingamadealies kernel: [100555.410370] usb 1-1: USB disconnect, device number 43
Jan 19 20:08:07 thingamadealies kernel: [100555.660059] usb 1-1: new high-speed USB device number 44 using ehci_hcd
Jan 19 20:08:07 thingamadealies kernel: [100555.794444] usb 1-1: New USB device found, idVendor=0bc2, idProduct=a0a4
Jan 19 20:08:07 thingamadealies kernel: [100555.794452] usb 1-1: New USB device strings: Mfr=2, Product=3, SerialNumber=1
Jan 19 20:08:07 thingamadealies kernel: [100555.794458] usb 1-1: Product: Backup+ Desk Mac
Jan 19 20:08:07 thingamadealies kernel: [100555.794463] usb 1-1: Manufacturer: Seagate
Jan 19 20:08:07 thingamadealies kernel: [100555.794467] usb 1-1: SerialNumber: XXXXXXXX
Jan 19 20:08:07 thingamadealies kernel: [100555.795636] scsi41 : usb-storage 1-1:1.0
Jan 19 20:08:07 thingamadealies mtp-probe: checking bus 1, device 44: "/sys/devices/pci0000:00/0000:00:1d.7/usb1/1-1"
Jan 19 20:10:46 thingamadealies kernel: [100714.601169] usb 1-1: USB disconnect, device number 44
Jan 19 20:10:46 thingamadealies kernel: [100714.872081] usb 1-1: new high-speed USB device number 45 using ehci_hcd
... etc ...
Às vezes isso acontece várias vezes por minuto. Ocasionalmente, as mensagens são impressas com alguns segundos uma da outra. Em outras ocasiões, esse comportamento é interrompido por várias horas ou até perto de um dia. Eu meio que suspeito, mas não tenho provas, de que isso possa estar relacionado ao momento em que o disco rígido está sob carga.
Nenhum outro erro de USB ou E / S ou outras mensagens relevantes são impressas no syslog e não sei mais onde procurar pistas.
A outra unidade não tem esse problema e funciona muito bem desde que o recebi.
O que eu tentei até agora:
- alternar quais conectores USB as unidades estão conectadas para verificar se a outra unidade começa a ter esse problema. Até agora não foi, mas faz apenas uma ou duas horas.
- Também pesquisei bastante no Google e encontrei outras pessoas com problemas semelhantes, mas nenhum exatamente como o meu, e ainda não encontrei uma solução. A maioria das pessoas com esse problema recebe pelo menos algum tipo de erro de USB no syslog junto com a mensagem "USB desconect".
Qualquer ajuda que alguém pudesse me dar seria muito apreciada! Realmente não sei como depurar um problema de hardware como este.
Atualizar:
Depois de alternar a quais conectores USB as unidades estão conectadas, a mensagem que está sendo enviada para o syslog mudou para:
usb 1-3: redefina o número de dispositivo USB de alta velocidade 4 usando ehci_hcd
Eu confirmei usb 1-3 é a unidade do problema. Então, algo ainda está errado, mas agora é algo ligeiramente diferente. Até agora, o ZFS não teve nenhum erro ... espero que continue assim.
Atualização 2:
O resilvering terminou! No entanto, ainda estou recebendo as mensagens "redefinir dispositivo USB de alta velocidade". Tentei alternar os cabos entre minhas duas unidades, mas não fez nenhuma diferença, então acho que isso exclui o problema de ser o cabo.
Eu vi algumas evidências de que a atualização do meu kernel pode corrigir isso, então vou tentar.
Atualização 3:
Atualizei meu kernel para 3.10, não teve efeito. Ainda não sei como consertar isso.
usb 4-1.5: USB disconnect, device number 3
usb 4-1.5: new low-speed USB device number 4 using ehci-pci
usb 4-1.5: New USB device found, idVendor=17ef, idProduct=6019
...