Le manuel du parfait plombier VSAN (maj continue)

Dernière mise à jour : 18/02/2021

Depuis que VSAN est arrivé sur nos infrastructures de production et que, par le truchement de quelques incidents, nous avons un peu progressé dans la connaissance et la maîtrise de cette technologies je vous propose de recenser les différentes infos et commandes utiles qui nous servent de plus en plus au quotidien. Je ferai évoluer ce billet spécifique au fur et à mesure de nos découvertes ! Evidemment, si vous avez des hints & tips à rajouter, n’hésitez pas non plus à me contacter directement ou a ajouter des commentaires à ce billet.

La liste des mises à jour se trouve en fin de billet. Ajoutez-le à vos favoris, au cas où !

Comment qu’il torche le petit cluster ?

J’ai eu l’occasion pendant la grosse mise à jour de mon vLab perso sur vSphere 7, d’avoir ponctuellement des pb de négociation sur mes liens ethernet. Dans la pratique c’était assez difficile de vraiment vérifier en live, en dehors de l’usage des tests de performance disponibles via l’interface html de vSphere… jsuqu’à ce que je découvre que l’outil « iperf » était intégré aux distributions ESXi 6.x/7.x ! Mon tour n’a fait qu’un sang ^^. Dans la pratique, cette outil permet de faire des tests temps réels de débit sur vos interfaces réseau. Sont usage est extrèmement simple : vous mettez en serveur en écoute et vous lancer un transfert bulk en mode client depuis un autre vers l’adresse cible. L’adresse étant souvent liée à un vmk précis, vous pouvez faire des tests dans tous les sens. Exemple : j’ai deux ESXi qui sont au sein d’un cluster VSAN et je veux tester les débits actuels entre les deux machine :

Pour obtenir les débits dans le sens « serveur cible -> serveur source », on va lancer iperf en mode serveur sur le serveur source, après avoir temporairement désactivé le pare-feu intégré de ESXi (ou avoir positionné l’ouverture du port iperf) :

[root@zeus:~] esxcli network firewall set --enabled false
[root@zeus:~] cp /usr/lib/vmware/vsan/bin/iperf3 /usr/lib/vmware/vsan/bin/iperf3.srv
[root@zeus:~] /usr/lib/vmware/vsan/bin/iperf3.srv -s -B 172.16.16.101 -V
iperf 3.1.6
VMkernel zeus 7.0.1 #1 SMP Release build-17551050 Feb  1 2021 09:59:12 x86_64
-----------------------------------------------------------
Server listening on 5201
-----------------------------------------------------------

[root@zeus:~] esxcli network firewall set --enabled false

[root@zeus:~] cp /usr/lib/vmware/vsan/bin/iperf3 /usr/lib/vmware/vsan/bin/iperf3.srv

[root@zeus:~] /usr/lib/vmware/vsan/bin/iperf3.srv -s -B 172.16.16.101 -V

iperf 3.1.6

VMkernel zeus 7.0.1 #1 SMP Release build-17551050 Feb 1 2021 09:59:12 x86_64

-----------------------------------------------------------

Server listening on 5201

-----------------------------------------------------------

D’après ce que j’ai compris, le vmkkernel interdit l’utilisation de iperf par défaut iperf en mode serveur, on doit donc d’abord copier l’exécutatble sous un autre nom pour pouvoir activer ce mode. Ensuite coté « serveur source », vous lancez iperf en mode client en pointant l’ip du « serveur cible ».

[root@cronos:~] esxcli network firewall set --enabled false
[root@cronos:~] /usr/lib/vmware/vsan/bin/iperf3 -c 172.16.16.101 -V -t 5
iperf 3.1.6
VMkernel cronos.vlab 7.0.1 #1 SMP Release build-17551050 Feb  1 2021 09:59:12 x86_64
Control connection MSS 1448
Time: Thu, 18 Feb 2021 09:28:48 GMT
Connecting to host 172.16.16.101, port 5201
      Cookie: cronos.vlab.1613640528.447625.79e3a5
      TCP MSS: 1448 (default)
[  4] local 172.16.16.102 port 14468 connected to 172.16.16.101 port 5201
Starting Test: protocol: TCP, 1 streams, 131072 byte blocks, omitting 0 seconds, 5 second test
iperf3: getsockopt - Function not implemented
[ ID] Interval           Transfer     Bandwidth       Retr  Cwnd
[  4]   0.00-1.00   sec   270 MBytes  2.27 Gbits/sec  8634728   0.00 Bytes
iperf3: getsockopt - Function not implemented
[  4]   1.00-2.00   sec   279 MBytes  2.34 Gbits/sec    0   0.00 Bytes
iperf3: getsockopt - Function not implemented
[  4]   2.00-3.00   sec   279 MBytes  2.34 Gbits/sec    0   0.00 Bytes
iperf3: getsockopt - Function not implemented
[  4]   3.00-4.00   sec   279 MBytes  2.34 Gbits/sec    0   0.00 Bytes
iperf3: getsockopt - Function not implemented
[  4]   4.00-5.00   sec   280 MBytes  2.34 Gbits/sec  4286332568   0.00 Bytes
- - - - - - - - - - - - - - - - - - - - - - - - -
Test Complete. Summary Results:
[ ID] Interval           Transfer     Bandwidth       Retr
[  4]   0.00-5.00   sec  1.35 GBytes  2.33 Gbits/sec    0             sender
[  4]   0.00-5.00   sec  1.35 GBytes  2.33 Gbits/sec                  receiver
CPU Utilization: local/sender 12.2% (12.3%u/0.0%s), remote/receiver 0.3% (0.3%u/0.0%s)
snd_tcp_congestion newreno
rcv_tcp_congestion newreno
iperf Done.
[root@cronos:~]

[root@cronos:~] esxcli network firewall set --enabled false

[root@cronos:~] /usr/lib/vmware/vsan/bin/iperf3 -c 172.16.16.101 -V -t 5

iperf 3.1.6

VMkernel cronos.vlab 7.0.1 #1 SMP Release build-17551050 Feb 1 2021 09:59:12 x86_64

Control connection MSS 1448

Time: Thu, 18 Feb 2021 09:28:48 GMT

Connecting to host 172.16.16.101, port 5201

Cookie: cronos.vlab.1613640528.447625.79e3a5

TCP MSS: 1448 (default)

[ 4] local 172.16.16.102 port 14468 connected to 172.16.16.101 port 5201

Starting Test: protocol: TCP, 1 streams, 131072 byte blocks, omitting 0 seconds, 5 second test