17-12-01 15-06-55 1565

Rognotudju du Vendredi : Allo, le support VxRail ?

EDIT du 04/12/2017 à 10h25 : Quelques précisions concernant la panne et les nouveaux délais … buarh.

Hé oui… désolé pour Dell EMC, ça tombe encore sur vous, mais vous cherchez un peu par moment, aussi, hein, en même temps ! Après le joli troll du service logistique en Mars/Avril dernier, c’est désormais du coté du support VxRail que ça se passe. Le 10 Octobre dernier, nous avons eu un gros incident sur l’un de nos clusters : un des nœuds a perdu d’un coup tout ses disques VSAN. Oops ! Bon, déjà quand un comportement de ce type se produit, a priori, comme ça, à vue de nez, en mode intuition, avez la réserve nécessaire … on s’imagine que ça sent quand même pas mal le problème hardware, un fond de panier en vrac, par exemple ou carte SAS plantée. Ceci étant, le SR est ouvert et le travail de collecte et de diagnostic commence de la part de la hotline.

En terme de fonctionnement, pas d’impact majeur, grâce au FTT1 appliqué sur l’ensemble des machines virtuelles, mais assez sérieux pour que nous suivions le call de près, même si par définition, un VxRail, ça s’installe … et ça s’oublie ou presque, en théorie du moins. De plus, comme cela ne concernait que les disques du nœud, la partie Hyperviseur pur continuait à marcher. Nous avions donc un compute opérationnel mais un VSAN sur 2 pattes au lieu de trois, pas si gênant que cela vu le workload hébergé sur ce VxRail : des machines de Test/Pré-production.

Maintenant, comme vous pouvez le constater, nous sommes le 1er décembre et le noeud n’est toujours pas remplacé. Pendant ces derniers 50 jours, nous avons eu droit à des tonnes de tests sur VSAN, des bascules diverses, des reboots, sessions Webex, des visites sur site de nos chers collègues d’EMC Nantes (qui font ce qu’ils peuvent pour nous aider) et j’en passe. Aujourd’hui, le nouveau noeud de remplacement (ENFIN ! c’était si dur de le changer plus tôt en se posant un peu moins de questions métaphysiques sur l’univers et tout le reste ?) est chez nous depuis 10 jour, à la louche, mais toujours pas branché et pas de news récente… désespérant :(

Alors, bon, je veux bien être early adopter sur des workload non critiques, mais faut pas pousser le bouchon un peu trop loin Michael…

Bonne fin de Vendredi et bon week-end à tous !

EDIT : L’aventure continue ! En fait, j’avais effectivement oublié, comme me l’ont justement rappelé mes collègues de la production, que ce n’était pas le noeud seul, mais carrément tout le fond de panier qu’il fallait changer (oops !). On vient de nous annoncer qu’en plus le nouveau chassis ne sera pas disponible avant la mi-décembre. Et bien sûr, il va falloir arrêter tout le bouzin pour pouvoir réinsérer les noeuds dans le nouveau hardware… chouette !