Diagnosi e sostituzione di un disco rigido difettoso (Server Dedicato Windows con software RAID)

In questo articolo ti spieghiamo come identificare un disco rigido difettoso su un Server Dedicato Windows con software RAID e come preparare il server per la sostituzione del disco rigido difettoso.

Nota bene:

I passaggi descritti in questo articolo presuppongono una conoscenza di base su come amministrare un server con Microsoft Windows. Se hai domande o hai bisogno di assistenza per la sostituzione di un disco rigido difettoso, contatta l'Assistenza Clienti IONOS.

Per garantire la massima affidabilità possibile, devi monitorare il software RAID del tuo Server Dedicato. Se scopri che un disco rigido è difettoso, o ricevi un'e-mail di notifica che ti informa che un disco rigido è difettoso, è necessario contattare la nostra Assistenza Clienti per organizzare la sostituzione del disco rigido. Per farlo, è necessario identificare il disco rigido difettoso e preparare il server per la sostituzione del disco difettoso.

Importante:

I sistemi RAID consentono una maggiore affidabilità e/o una maggiore velocità. Tuttavia, non sostituiscono i backup regolari. Per evitare la perdita di dati, ti consigliamo di eseguire regolarmente il backup dei tuoi dati. Assicurati inoltre di eseguire il backup dei tuoi dati prima di eseguire le operazioni descritte di seguito per garantire la sicurezza dei tuoi dati.

Diagnosi dei guasti e determinazione dei dati necessari per la sostituzione del disco rigido

Al fine di rilevare gli errori del disco rigido, ti consigliamo di procedere come segue:

Installa il programma Smartctl. Smartctl è un programma a riga di comando per monitorare i volumi utilizzando la tecnologia SMART (Self-Monitoring, Analysis and Reporting Technology). Con questo programma è possibile verificare se un disco rigido è difettoso.

Nota bene:

In alcuni casi può accadere che un difetto del disco rigido non possa essere rilevato dai valori smart. Per questo motivo, ti consigliamo di eseguire sempre un'analisi aggiuntiva dei file di log sul tuo server.

Installare Smartctl

Al seguente URL troverai le istruzioni per l'installazione di Smartmontools:

https://www.smartmontools.org/wiki/Download#InstalltheWindowspackage

Visualizzare informazioni dettagliate per la risoluzione dei problemi

Smartctl si comporta allo stesso modo sia su Windows che su Linux. Per questo motivo, puoi utilizzare gli stessi comandi. Per utilizzare Smartctl per la risoluzione di problemi, è necessario aprire il prompt dei comandi e passare alla directory in cui si trovano gli Smartmontools. Successivamente puoi inserire i comandi Linux mostrati di seguito per visualizzare informazioni dettagliate per la risoluzione di problemi.

Per visualizzare l'elenco dei dischi rigidi, digita il seguente comando:

smartctl --scan
Esempio:

C:\Program Files\smartmontools\bin>smartctl --scan

/dev/sda -d sat # /dev/sda [SAT], ATA device
/dev/sdb -d sat # /dev/sdb [SAT], ATA device
/dev/csmi0,2 -d ata # /dev/csmi0,2, ATA device
/dev/csmi0,3 -d ata # /dev/csmi0,3, ATA device

Per visualizzare informazioni dettagliate per la risoluzione di problemi, digita il seguente comando:

smartctl -iHAl error [NOMEDELDISCORIGIDO]
Esempio:
C:\Program Files\smartmontools\bin>smartctl -iHAl error /dev/sda

Nota bene:

Le interfacce dei dispositivi devono essere specificate nel seguente formato:

Dispositivi SCSI / SATA:
smartctl - iHAl error /dev/sd[a-z]

Esempio: C:\Program Files\smartmontools\bin>smartctl -iHAl error /dev/sda

Dopo aver inserito il comando, visualizzerai ad es. le seguenti informazioni:

C:\Program Files\smartmontools\bin>smartctl -iHAl error /dev/sda

smartctl 7.0 2018-12-30 r4883 [x86_64-w64-mingw32-2016] (sf-7.0-1)
Copyright (C) 2002-18, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Hitachi/HGST Ultrastar 7K2
Device Model:     HGST HUS722T1TALA604
Serial Number:    WMC6M0JAUEV8
LU WWN Device Id: 5 0014ee 00482c2ec
Firmware Version: RAGNWA07
User Capacity:    1,000,204,886,016 bytes [1.00 TB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    7200 rpm
Form Factor:      3.5 inches
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-3 T13/2161-D revision 5
SATA Version is:  SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Thu Jan 17 06:17:05 2019 CAST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG   VALUE WORST THRESH TYPE     UPDATED WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f 200   200   051    Pre-fail Always      -       0
  3 Spin_Up_Time            0x0027 141   140   021    Pre-fail Always      -       3933
  4 Start_Stop_Count        0x0032 100   100   000    Old_age  Always      -       15
  5 Reallocated_Sector_Ct   0x0033 200   200   140    Pre-fail Always      -       0
  7 Seek_Error_Rate         0x002e 200   200   000    Old_age  Always      -       0
  9 Power_On_Hours          0x0032 100   100   000    Old_age  Always      -       34
 10 Spin_Retry_Count        0x0032 100   253   000    Old_age  Always      -       0
 11 Calibration_Retry_Count 0x0032 100   253   000    Old_age  Always      -       0
 12 Power_Cycle_Count       0x0032 100   100   000    Old_age  Always      -       10
 16 Gas_Gauge               0x0022 000   200   000    Old_age  Always      -       1822115874
183 Runtime_Bad_Block       0x0032 100   100   000    Old_age  Always      -       0
192 Power-Off_Retract_Count 0x0032 200   200   000    Old_age  Always      -       6
193 Load_Cycle_Count        0x0032 200   200   000    Old_age  Always      -       9
194 Temperature_Celsius     0x0022 113   109   000    Old_age  Always      -       30
196 Reallocated_Event_Count 0x0032 200   200   000    Old_age  Always      -       0
197 Current_Pending_Sector  0x0032 200   200   000    Old_age  Always      -       0
198 Offline_Uncorrectable   0x0030 100   253   000    Old_age  Offline     -       0
199 UDMA_CRC_Error_Count    0x0032 200   200   000    Old_age  Always      -       0
200 Multi_Zone_Error_Rate   0x0008 100   253   000    Old_age  Offline     -       0

SMART Error Log Version: 1
No Errors Logged

Interpretazione dei parametri e diagnosi dei guasti

Analizza le informazioni dettagliate che hai ottenuto con il comando smartctl -iHAl error [NOMEDELDISCORIGIDO]. Nella prima sezione sono ocntenute informazioni che puoi utilizzare per identificare il disco rigido:

=== START OF INFORMATION SECTION ===
Model Family:     Hitachi/HGST Ultrastar 7K2
Device Model:     HGST HUS722T1TALA604
Serial Number:    WMC6M0JAUEV8
LU WWN Device Id: 5 0014ee 00482c2ec
Firmware Version: RAGNWA07
User Capacity:    1,000,204,886,016 bytes [1.00 TB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    7200 rpm
Form Factor:      3.5 inches
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-3 T13/2161-D revision 5
SATA Version is:  SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Thu Jan 17 06:17:05 2019 CAST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

In questa sezione puoi visualizzare, tra le altre cose, il modello del dispositivo e il numero di serie del disco rigido che stai analizzando.

Nella seconda sezione, viene valutato da Smartctl lo stato attuale del disco rigido. Se, ad esempio, visualizzi il valore "Failed" o "UNKNOWN" al posto di "PASSED", è necessario sostituire il disco rigido il prima possibile.

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

Nella terza sezione, puoi visualizzare in dettaglio i valori smart che sono stati determinati. Accanto ad ogni valore percentuale attuale (VALUE), vengono elencati il valore peggiore misurato (WORST)e il rispettivo valore limite (THRESH). Se il valore percentuale attuale (VALORE) o il valore peggiore misurato (WORST) supera il valore limite (THRESH), visualizzerai nella colonna WHEN_FAILED un avviso SMART (ad es. FAILING_NOW).

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0027   141   140   021    Pre-fail  Always       -       3933
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       15
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       34
 10 Spin_Retry_Count        0x0032   100   253   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   253   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       10
 16 Gas_Gauge               0x0022   000   200   000    Old_age   Always       -       1822115874
183 Runtime_Bad_Block       0x0032   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       6
193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       9
194 Temperature_Celsius     0x0022   113   109   000    Old_age   Always       -       30
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   100   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   100   253   000    Old_age   Offline      -       0

I seguenti parametri possono indicare la minaccia di un guasto imminente del disco rigido prima che questo venga visualizzato in un avviso SMART:

Reallocated_Sector_Ct: specifica il numero di settori che sono stati riassegnati a causa di errori di lettura. Se un settore non può più essere letto, scritto o controllato correttamente, gli viene automaticamente assegnato un settore di sostituzione. Il settore difettoso è contrassegnato in modo permanente come illeggibile. Se questo valore non è uguale a zero, è probabile che si verificherà un guasto del disco rigido. Questo valore è l'indicatore più importante per la sostituzione di un disco rigido.

Current_Pending_Sector_Ct: specifica il numero di settori instabili in attesa di rimappatura. Se un settore non può essere letto e scritto correttamente, riceve prima lo stato "Current Pending Sector". Il settore non viene riassegnato in questo stato, poiché i dati del settore sono sconosciuti. Solo dopo diversi tentativi di lettura o scrittura non riusciti viene assegnato un settore di sostituzione e il settore difettoso viene contrassegnato in modo permanente come illeggibile. Il valore Current_Pending_Sector_Ct è un indicatore importante per la sostituzione di un disco rigido. Se questo valore non è uguale a zero, è probabile che si verificherà un guasto del disco rigido.

Offline_Uncorrectable: specifica il numero di errori agli accessi di lettura e scrittura per un settore.

L'ultima sezione riguarda il log interno del disco rigido. Gli errori vengono registrati qui se gli ordini di lavoro del server non sono stati elaborati correttamente dal disco rigido. Se il numero di errori in questa sezione è di almeno due cifre, è necessario sostituire il disco rigido il prima possibile.

SMART Error Log Version: 1
No Errors Logged

Visualizzare informazioni dettagliate per la sostituzione del disco

Le seguenti informazioni sono necessarie per sostituire il disco rigido difettoso:

  • Denominazione del disco rigido nel RAID (ad es. sda)

  • Numero di serie

  • Modello

  • File di log (opzionale)

Creare un log SMART

Per creare un log SMART completo, digita il seguente comando:

smartctl -x [NOMEDELDISCORIGIDO]
Esempio:

C:\Program File\smartmontools\bin>smartctl -x /dev/sda -x

Nota bene:
  • Se il log SMART è stato creato come descritto sopra, questo contiene le informazioni sufficienti per sostituire il disco rigido.

  • Se non è possibile visualizzare il numero di serie del disco rigido difettoso utilizzando Smartctl, puoi, in alternativa, fornire all'Assistenza Clienti il numero di serie del disco rigido o dei dischi rigidi che sono funzionanti.

Organizzare la sostituzione del disco rigido

A questo punto, il disco rigido difettoso può essere sostituito. Per farlo, contatta l'Assistenza Clienti IONOS.

Passaggi necessari dopo la sostituzione del disco rigido

Dopo aver sostituito il disco rigido difettoso, è necessario ricostruire il software RAID. Per ulteriori informazioni su come ricostruire un software RAID, consulta il seguente articolo: Ricostruire un software RAID (Windows)


Le informazioni fornite ti sono state utili?

Il tuo feedback ci aiuta a migliorare continuamente i nostri servizi! Accedi al tuo account IONOS cliccando sul pulsante di accesso in alto a destra e, successivamente, lasciaci una valutazione sotto l'articolo.