Plus de peur que de mal sur le bug “CBT” d’ESXi build 3825889

Je vous expliquais en début de semaine dernière avoir découvert via Twitter un nouveau bug type “CBT” concernant les backups Windows utilisant le Quiecse “VSS” propre aux OS de Microsoft. Depuis, VMware a enfin communiqué sur le sujet et confirme le dysfonctionnement. Voici quelques liens à suivre pour vous tenir au courant de la résolution – en cours – de ce problème spécifique à la dernière build d’ESXi parue fin Mai :

La confirmation du bug sur un blog corporate : http://blogs.vmware.com/kb/2016/06/windows-2008-incremental-backups-become-full-backups-esxi-6-0-b3825889.html
Le KB#2145895 qui vous permettra de suivre sa résolution : https://kb.vmware.com/selfservice/microsites/search.do?language=en_US&cmd=displayKC&externalId=2145895

Vous constaterez que contrairement au premier – méchant – bug CBT de la fin de l’année dernière, le seul impact est que les backups incrémentaux génèrent en fait des backups full, mais a priori, cette fois-ci, pas de corruption des sauvegardes. Ouf ! Bon, en même temps, cela ne nous a pas empêché de passer plus de 2 jours pas moins de 4 jours à traiter ce problème spécifique sur nos clusters de production… un petit coucou à Antoine au pasage, éminent membre de notre équipe de production, qui s’y est collé tout le début de la semaine dernière alors que bien sûr, il n’avait rien d’autre à faire :)

D’une manière plus générale, cela nous confirme qu’il va nous falloir être moins “up-to-date” que nous le souhaiterions sur nos environnements ESXi à l’avenir. Nous avons en effet décidé de programmer des phases de maintenance dédiées tous les trimestres (sauf patch urgent évidemment) en excluant systématiquement les patchs datant de moins de 3 mois (une petite modification des règles Update Manager permet de faire ça sans se poser de questions). On s’assure ainsi que les patchs VMware sont bien “secs” au moment de leur passage en prod chez nous.

2 thoughts on “Plus de peur que de mal sur le bug “CBT” d’ESXi build 3825889

  1. Antoine says:

    * coucou ! * :)

    “cela ne nous a pas empêché de passer plus de 2 jours à traiter ce problème spécifique sur nos clusters de production”

    Tu peux dire 4 bons jours. Du lundi midi au jeudi milieu d’après midi..

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *