Método rápido para determinar a integridade da unidade SSD?


13

Eu tenho uma unidade Intel X-25M marcada como "falhou" duas vezes em uma matriz de armazenamento ZFS, conforme observado aqui . No entanto, após remover a unidade, ela parece montar, ler e gravar em outros computadores (Mac, PC, gabinete USB, etc.)

Existe uma boa maneira de determinar a saúde atual da unidade? Eu sinto que a falha anterior na solução ZFS foi a convergência de bugs, relatórios de erros ruins e hardware. Parece que essa unidade pode ter alguma vida nela, no entanto.


é um g1 ou um g2?
Jim B

Esta é uma unidade G2 de 120GB X25-M.
ewwhite

Respostas:


12

Uma maneira boa, mas não infalível, de verificar a integridade de qualquer unidade é verificar os atributos SMART.

Abaixo está o atributo SMART definido para um disco Intel X25-M G2 de 160 GB, obtido usando o smartctl v5.41. (A versão é importante, as versões anteriores do smartctl tinham mapeamentos de nomes de atributos diferentes e, na verdade, não entendiam corretamente a tabela específica para esta unidade).

# ./smartctl -data -A /dev/sda
smartctl 5.41 2011-06-09 r3365 [x86_64-linux-2.6.18-194.32.1.el5] (local build)
Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 5
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED     RAW_VALUE
  3 Spin_Up_Time            0x0020   100   100   000    Old_age   Offline      -       0
  4 Start_Stop_Count        0x0030   100   100   000    Old_age   Offline      -       0
  5 Reallocated_Sector_Ct   0x0032   100   100   000    Old_age   Always       -       1
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       4076
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       67
192 Unsafe_Shutdown_Count   0x0032   100   100   000    Old_age   Always       -       30
225 Host_Writes_32MiB       0x0030   200   200   000    Old_age   Offline      -       148418
226 Workld_Media_Wear_Indic 0x0032   100   100   000    Old_age   Always       -       755
227 Workld_Host_Reads_Perc  0x0032   100   100   000    Old_age   Always       -       49
228 Workload_Minutes        0x0032   100   100   000    Old_age   Always       -       16956537
232 Available_Reservd_Space 0x0033   099   099   010    Pre-fail  Always       -       0
233 Media_Wearout_Indicator 0x0032   098   098   000    Old_age   Always       -       0
184 End-to-End_Error        0x0033   100   100   099    Pre-fail  Always       -       0

Isso mostra que o inversor teve 1 setor realocado, usou 1% de seu espaço reservado disponível (atributo 232) e 2% de seus ciclos projetados de programa / apagamento (atributo 233). Ele teve 148418 * 32MiB (atributo 225) gravado nele.

Se a unidade estiver mostrando um número significativo de setores realocados, isso pode ser motivo de preocupação, pois isso provavelmente indica um chip flash com falha (da mesma maneira que um número significativo de setores realocados em um disco rotativo geralmente aponta para erros de superfície ) De ponta a ponta também são ruins - alguns discos X25-M G2 de 160 GB falharam com relatórios grandes (> 1000) de erros de ponta a ponta. No entanto, existem realmente apenas dois atributos úteis de condição de erro para esses discos, pois a maioria dos atributos SMART úteis para discos normais não se aplica a SSDs.

No entanto, o SMART geralmente não é considerado 100% confiável. O estudo do Google sobre falhas de disco descobriu que, embora houvesse boas correlações entre os vários indicadores de alerta precoce SMART e a falha na unidade, não era uma ferramenta útil para prever falhas individuais na unidade. Por esse motivo, geralmente uso o SMART como uma maneira de provar que uma unidade é ruim (se houver erros, provavelmente falhará em breve), em vez de provar que uma unidade ainda é boa.


1
Observe que o estudo do Google se concentrou nas indicações de pré-falha da SMART, que se mostraram menos confiáveis. Os relatórios sobre condições de falha são um pouco mais precisos.
Chris S

2

Embora tenha sido feito para discos rígidos "tradicionais", o utilitário "badblocks" pode ser de algum benefício, pois destina-se a exercer todos os setores mapeados na unidade. Com a prevenção de fragmentação de SSD e os remapeamentos internos, não será possível dizer com certeza que a unidade está boa. No entanto, se isso lhe disser que a unidade está ruim, certamente a jogarei fora como morta.


1

O HD Tune (e o HD Tune Pro ) são ótimas ferramentas para medir a saúde e o desempenho da sua unidade SSD. A versão gratuita (HD Tune) tem um conjunto de recursos muito limitados, mas a análise de saúde se enquadra nisso, então você teve sorte. A versão Pro possui um período de avaliação de 15 dias, que eu recomendo tentar, fornecerá uma excelente análise aprofundada sobre o desempenho do seu SSD.

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.