img_7415

vSphere 6.5, pour nous, les administrateurs

Et oui, malgré les grandes annonces de vSphere 6.5 portant sur la sécurité et les phases d’installation et migration, il ne faut pas oublier le quotidien malgré tout, n’est-ce pas ? VMware ne nous a pas oublié sur ces aspects non plus. Ce billet vous propose de faire le point sur les nouveautés autour de vSphere HA, Fault Tolerance, DRS, SIOC et pour finir, the last but not the least, ENFIN une Content Library utilisable (si si)…

Allons-y, jetons-nous dans ce listing que je vous promet d’agrémenter de quelques exclamations ou remarques pas piquées des hannetons, afin d’éviter toute monotonie dans le discours :)

Lire la suite …

Photo-2015-06-23-15-32-24_7045

“Must” et “Should” sont dans un bateau …

En ce moment, le sort s’acharne sur notre belle production :(

Après une coupure de 3 fibres noires sur 4 (ouf !) fin Mai pendant plusieurs heures entraînant de nombreuses perturbations, voici que ce midi même, une de nos salle informatique a perdu ses deux alimentations électriques simultanément ! Toute la salle s’est donc retrouvée dans le “noir” pendant environ 10 minutes. L’effet fut immédiat sur l’ensemble de nos infrastructures : une bascule PRA en bonne et due forme. Certes, nous effectuons des campagnes de test et d’entretien régulières de nombreux composants servant de support à ces situations d’urgence, mais jamais tous en même temps (réseau, fibre channel, serveurs et baies). Un élément extérieur nous en a donc donné l’occasion, bien malgré nous !

Lire la suite …

ram-chart

PoC XtremIO : coupure d’un contrôleur, sans sueurs froides :)

Pour ceux qui ont une expérience de production critique, la perte d’un contrôleur au sein d’une baie disque est souvent le moment quelques sueurs froides, même lorsque le constructeur vous donne toute les garanties de continuité nécessaires. Ceci étant et toutes proportions gardées, dans le cadre d’un PoC digne de ce nom, nous avons procédé à une coupure d’alimentation complète sur un des deux storage controlers de la X-Brick. La où le challenge est à mon sens plus important chez XtremIO que sur d’autres équipements plus classique (VNX, CX au moins), c’est que les deux contrôleurs partagent l’ensemble de leur mémoire centrale via un bus Infiniband où se trouve la table des metadata associées aux données sur disques, ce qui donne plus de “poids” à ce type de test.

Je ne vais pas trop faire durer le suspens, tout s’est très bien passé, sans impact sur les environnements de test. Par contre, la console d’administration était assez angoissante, jugez plutôt :
ctrl1

Après quelques minutes de fonctionnement sur un seul contrôleur, nous avons rebranché le second. Au bout de quelques 7 minutes, qui ont paru assez longues, je ne vous le cache pas, nous avons retrouvé progressivement notre baie en mode nominal. Le seul impact visible du coté VPlex a été la perte de deux chemins logiques, évidemment.

Quelques screenshots complémentaires, pendant la phase de “remontée” du storage controler :
ctrl2bbufail