Wissensdatenbank
Buehl, Kevin
10 September 2017
10 September 2017
2.450

Wissensdatenbank

VMware vSAN fehlerhafte SSD austauschen

Situation


Ich hatte heute den Fall, das eine SSD (Cache) meines virtuellen SANs ausgefallen ist. Also habe ich diese kurzer Hand einfach aus dem Server entfernt und durch eine neue ersetzt. Anbei erkläre ich wie ich diese wieder integriert habe.

Hinweis: Da der Server HotPlug unterstützt habe ich diesen Prozess ohne Neustart durchgeführt.

RAID Konfigurieren


Volume entfernen


Da die SSD an einem RAID Controller angeschlossen ist, muss ich das alte RAID0 Gerät zuerst entfernen:
esxcli ssacli cmd -q "ctrl all show config"
Smart Array P222 in Slot 1                (sn: 4B424B424B424R)
Array A (Solid State SATA, Unused Space: 0 MB)
logicaldrive 1 (238.4 GB, RAID 0, Failed)
physicaldrive 2I:1:1 (port 2I:box 1:bay 1, SATA SSD, 256 GB, OK)
esxcli ssacli cmd -q "ctrl slot=1 ld 1 delete forced"
Warning: Deleting an array can cause other array letters to become renamed.
E.g. Deleting array A from arrays A,B,C will result in two remaining
arrays A,B ... not B,C

Volume erstellen


esxcli ssacli cmd -q "ctrl all show config"
Smart Array P222 in Slot 1                (sn: 4B424B424B424R)
Unassigned
physicaldrive 2I:1:1 (port 2I:box 1:bay 1, SATA SSD, 256 GB, OK)
esxcli ssacli cmd -q "ctrl slot=1 create type=ld drives=2I:1:1 raid=0"
Warning: SSD Over Provisioning Optimization will be performed on the physical
drives in this array. This process may take a long time and cause this
application to appear unresponsive.

Warning: Creation of this logical drive has caused array letters to become
renamed.


Status

esxcli ssacli cmd -q "ctrl all show config"
Smart Array P222 in Slot 1                (sn: 4B424B424B424R)
Internal Drive Cage at Port 2I, Box 1, OK
Array A (Solid State SATA, Unused Space: 0 MB)
logicaldrive 1 (238.4 GB, RAID 0, OK)
physicaldrive 2I:1:1 (port 2I:box 1:bay 1, SATA SSD, 256 GB, OK)
Array B (SATA, Unused Space: 0 MB)
logicaldrive 2 (3.6 TB, RAID 0, OK)
physicaldrive 2I:1:2 (port 2I:box 1:bay 2, SATA HDD, 4 TB, OK)


vSAN konfigurieren


Festplatten entfernen


Hier ein wichtiger Hinweis, wenn Sie die SSD Cache Disk verlieren, verlieren Sie komplette Disk Group des Hosts. Kurz gesagt, Cache weg = Daten weg. Ich bin zuerst erschrocken, da ich die SSD nicht entfernen konnte.
4b42
Lesen Sie die Disks aus und suchen Sie Ihre Daten Festplatte:
ls -lah /dev/disks
-rw-------    1 root     root      238.4G Sep  9 22:46 naa.600508b1001c12041ace7b16c9179fcb
-rw------- 1 root root 3.6T Sep 9 22:46 naa.600508b1001cafa694609d8bae019128
Entfernen Sie diese anschliessen vom vSAN Speicher:
esxcli vsan storage remove -d naa.600508b1001cafa694609d8bae019128

Partitionen löschen

Partitionen entfernenPartitionen entfernen

Partitionen entfernen


Nun können Sie die Partitionen auf der Festplatte entfernen, damit Sie diese später wieder zum vSAN hinzufügen können.

Disk Group erstellen

Festplattengruppe erstellenFestplattengruppe erstellen

Festplattengruppe erstellen


Nun können Sie im vSAN Cluster eine neue Disk Group erstellen und die beiden Geräte (SSD und HDD) wieder hinzufügen.

Funktionskontrolle

vSAN StatusvSAN Status

vSAN Status


Zum Schluss sollte man den Status prüfen, ich habe festgestellt, das kein Rebuild des vSANs ausgeführt wird.
esxcli system settings advanced list -o /VSAN/ClomRepairDelay
   Path: /VSAN/ClomRepairDelay
Type: integer
Int Value: 60
Default Int Value: 60
Min Value: 0
Max Value: 4294967295
String Value:
Default String Value:
Valid Characters:
Description: Minutes to wait for absent components to come back before starting repair