Wissensdatenbank
Buehl, Kevin
20 April 2016
2.425

Wissensdatenbank

Festplatten an Hewlett-Packard Smart Array P410 mit SmartMonTool testen

Inhaltsverzeichnis

Vorwort

Nachdem ich gestern die Firmware meines HP Smart Array P410 RAID Controllers von 6.00 auf 6.64 aktualisiert habe, habe ich heute erneut einen Kernel Panic erhalten. Aus diesem Grund habe ich die Festplatten-Werte ausgelesen und angefangen zu analyiseren.

Status


smartctl -A -d cciss,0 /dev/sda
smartctl 6.4 2014-10-07 r4002 [x86_64-linux-3.16.0-4-amd64] (local build)
Copyright (C) 2002-14, Bruce Allen, Christian Franke, www.smartmontools.org

/dev/sda [cciss_disk_00] [SAT]: Device open changed type from 'sat,auto+cciss' to 'sat'
--- START OF READ SMART DATA SECTION ---
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 117 099 006 Pre-fail Always - 120196368
3 Spin_Up_Time 0x0003 091 091 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 97
5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail Always - 8
7 Seek_Error_Rate 0x000f 084 060 030 Pre-fail Always - 278792668
9 Power_On_Hours 0x0032 080 080 000 Old_age Always - 17871
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 87
183 Runtime_Bad_Block 0x0032 098 098 000 Old_age Always - 2
184 End-to-End_Error 0x0032 100 100 099 Old_age Always - 0
187 Reported_Uncorrect 0x0032 066 066 000 Old_age Always - 34
188 Command_Timeout 0x0032 100 099 000 Old_age Always - 2 2 2
189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0022 081 059 045 Old_age Always - 19 (Min/Max 19/20)
191 G-Sense_Error_Rate 0x0032 100 100 000 Old_age Always - 0
192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always - 79
193 Load_Cycle_Count 0x0032 099 099 000 Old_age Always - 3921
194 Temperature_Celsius 0x0022 019 041 000 Old_age Always - 19 (0 10 0 0 0)
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
240 Head_Flying_Hours 0x0000 100 253 000 Old_age Offline - 17803h+06m+25.254s
241 Total_LBAs_Written 0x0000 100 253 000 Old_age Offline - 58750452905
242 Total_LBAs_Read 0x0000 100 253 000 Old_age Offline - 174425733638

Analyse


Hier fällt sofort auf das die folgenden Werte sehr hoch sind:
  1 Raw_Read_Error_Rate     0x000f   117   099   006    Pre-fail  Always       -       120196368
7 Seek_Error_Rate 0x000f 084 060 030 Pre-fail Always - 278792668

Allerdings hat Seagate im Vergleich zu anderen Festplatten-Herstellern hier eine andere Ansicht. Die Werte für Raw_Read_Error_Rate und Seek_Error_Rate sind 48bit Werte. Die ersten 16bit enthalten die Fehler und die letzten 32bit die Vorgänge. Rechnet man nun den Wert 120 196 368 in Hexadezimal um ergibt sich 0x72A0D10, bedeutet die ersten 16bit sind leer (0) somit sind keine Fehler aufgetreten.
Das gleiche gilt auch für Seek_Error_Rate 278 792 668 in Hexadezimal 0x109E09DC, wieder sind die ersten 16bit 0.

Solange also die folgnden Werte gering sind oder bei 0 liegen ist alles in Ordnung:
  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       8
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0