Update du 24/11/2015 : VMWare a mis à jour sa page décrivant le bug en question et vient d’annoncer que la root cause de celui-ci était désormais identifiée et que ce bug faisait partie des bugs les plus prioritaires. On devrait avoir des nouvelles très bientôt donc… à suivre :)
Update du 25/11/2015 : le correctif est enfin disponible, plus d’info sur ce billet.
ESXi est un hyperviseur qui a, somme toute, une excellente réputation depuis des années en matière de stabilité et de robustesse. Pour autant, comme tout produit, quel qu’il soit, il n’est pas à l’abris d’un bug. Celui-là, tout récemment découvert est tout de même assez “énorme”. Enorme, dans le sens où d’une part, sa portée est particulièrement critique, et d’autre part, les solutions de contournement actuellement proposées ne sont, c’est le moins que l’on puisse dire, pas satisfaisantes du tout.
Petit tour du bug en question…
Il s’agit d’un bug qui affecte la fonction dite de “CBT” (Change Block Tracking). Arrivée avec vSphere 4, cette fonctionnalité offre un mécanisme universel et très élégant à toutes les solutions de sauvegarde de machines virtuelles en mode disque (Veeam, Avamar, Netbackup etc. …). Le CBT permet en effet de fournir la liste des blocks modifiés depuis le dernier passage du système de sauvegarde, autorisant du même coup des backups incrémentaux particulièrement efficaces et rapides.
Le problème est lié à une erreur de code dans la bibliothèque “disklib” qui n’enregistre pas correctement les modifications sur disque lors des opérations de consolidation de snapshots (une suppression de snap par exemple). Cela signifie que le log CBT n’est pas cohérent par rapport à la liste réelle des blocks modifiés : pas de cohérence, donc une sauvegarde potentiellement corrompue … outch.
Et là où ça devient plus qu’ennuyeux, c’est que les 3 solutions de contournement proposées actuellement sont plus que limite :
1. Ne faites que des sauvegardes totales et plus incrémentales (outch !)
2. Revenez en ESXi 5.5 (outch !!)
3. Arrêter chaque VM avant de la sauvegarder (outch !!!)
Autant dire que pour tous ceux qui sont déjà passés en full vSphere 6… Il va falloir serrer vous savez quoi très très fort le temps qu’un patch soit proposé. Qui plus est, le problème touche autant ESXi 6.0 que la récente 6.0u1 …
Pour plus d’information sur ce sujet brûlant que je vous conseille de suivre de près, rendez-vous sur la page du KB #2136854 chez VMWare :
http://kb.vmware.com/selfservice/microsites/search.do?language=en_US&cmd=displayKC&externalId=2136854
Source : http://www.running-system.com/attention-new-cbt-bug-in-vsphere-esxi-6-0/
Merci également à Mickael d’APX/Axians pour l’info !
ben tiens… j’allais migrer… ben je vais attendre encore un peu…