Le manuel du parfait plombier VSAN (maj continue)

Depuis que VSAN est arrivé sur nos infrastructures de production et que, par le truchement de quelques incidents, nous avons un peu progressé dans la connaissance et la maîtrise de cette technologies je vous propose de recenser les différentes infos et commandes utiles qui nous servent de plus en plus au quotidien. Je ferai évoluer ce billet spécifique au fur et à mesure de nos découvertes ! Evidemment, si vous avez des hints & tips à rajouter, n’hésitez pas non plus à me contacter directement ou a ajouter des commentaires à ce billet.

La liste des mises à jour se trouve en fin de billet. Ajoutez-le à vos favoris, au cas où !

Comment qu’il va le petit cluster ?

Pour ceux qui ne sont pas encore en vSphere 6.7, aller voir rapidement l’état de votre cluster VSAN est plutôt très lourd, via le client Flash. Un méthode, de mon point de vue, beaucoup plus efficace est de passer par une petite session ssh sur un serveurs ESXi :

Cette commande, lorsqu’elle est lancée, réalise en même temps un refresh et vous donne l’état global de votre VSAN à l’instant T. Si tout est “green” (Moultipass … désolé ^^), c’est que tout va bien, si vous avez du “red” ou du “yellow”, vous devez avoir des alertes équivalentes dans votre interface vSphere et vous pouvez, dans la foulée utilisez cette commande pour en savoir un peu plus sur l’alerte :

Sur l’exemple ci-dessus, vous avez le détail du métrique “Disk format version” en erreur. Vous noterez que vous devez indiquer le nom exact du métrique dans la commande pour obtenir le résultat. Ces commandes peuvent aussi vous aider à récupérer rapidement des informations sur la configuration de votre environnement. Exemple suivant :

A la suite d’un problème sur votre VSAN ayant entraîné la perte temporaire d’un noeud ou une phase de maintenance d’un d’entre eux, par exemple, vous pouvez monitorer la reconstruction/resynchronisation sur chaque host :

A noter tout de même que la commande est “local” au nœud sur lequel vous vous trouvez, et pas cluster-wide, contrairement aux commandes précédentes.

Y va pas bien le petit cluster ?

Si vous êtes phase de remplacement d’un disque et que vous préférez la ligne de commande à l’interface web, vous pouvez piloter l’extraction du disque et sa ré-insertion après son remplacement. Pour se faire, vous avez trois groupes de commandes qui vont vous aider : “esxcli vsan”, “esxcfg-mpath” et “esxcfg-scsidevs”. Pour obtenir la liste (sur la machine sur laquelle vous êtes logguée) des disques VSAN configurés :

Chaque disque est identifié via son nom “hardware”, de type naa.XXXXXX, ainsi que son UUID VSAN, du type “52003dad-00fb-8539-9d6b-eca71b7f64a8”. Pour obtenir ses spécifications physiques, on peut utiliser esxcfg-scscidevs :

De même, on peut également récupérer son emplacement “physique” via esxcfg-mpath :

Vous noterez les informations sur la ligne “Adapter:” indiquant son identifiant SCSI. Enfin, il vous reste à vérifier sur l’iDrac/ILO ou tout autre interface de gestion hardware de votre serveur la correspondance de localisation de cette “target” sur le fond de panier.

Une fois le disque identifié, vous pouvez normalement, le supprimer/ré-inserer dans la configuration de VSAN via des commandes de type “esxcli vsan storage add” ou “esxcli vsan storage remove”. Cette commande accepte des noms de disque correspondant à leur “identité hardware”, c’est à dire du type “vmhba3:C0:T4:L0”. Dans le cas d’un cluster VSAN Full-Flash avec les options de réduction de données activées (Compression/Dédup), il vous faudra au préalable sortir tout le diskgroup dont fait partie le disque à remplacer. Dans ces conditions vous pouvez utiliser au préalable les commandes du type “esxcli vsan storage diskgroup mount/umount”. Pour ces cas d’usage, je ferai une mise à jour de ce billet avec des exemples concrets dès que j’aurais eu l’occasion de récupérer des traces de celles-ci. J’ai déjà eu l’occasion de les employer récemment, mais malheureusement, je n’ai pas eu la présence d’esprit de conserver les logs. En attendant, vous pouvez aller consulter le KB#2150567 chez VMware.

… mise à jour continue …
05/08/2018: Version initiale

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.