PoC XtremIO : coupure d’un contrôleur, sans sueurs froides :)

Pour ceux qui ont une expérience de production critique, la perte d’un contrôleur au sein d’une baie disque est souvent le moment quelques sueurs froides, même lorsque le constructeur vous donne toute les garanties de continuité nécessaires. Ceci étant et toutes proportions gardées, dans le cadre d’un PoC digne de ce nom, nous avons procédé à une coupure d’alimentation complète sur un des deux storage controlers de la X-Brick. La où le challenge est à mon sens plus important chez XtremIO que sur d’autres équipements plus classique (VNX, CX au moins), c’est que les deux contrôleurs partagent l’ensemble de leur mémoire centrale via un bus Infiniband où se trouve la table des metadata associées aux données sur disques, ce qui donne plus de “poids” à ce type de test.

Je ne vais pas trop faire durer le suspens, tout s’est très bien passé, sans impact sur les environnements de test. Par contre, la console d’administration était assez angoissante, jugez plutôt :
ctrl1

Après quelques minutes de fonctionnement sur un seul contrôleur, nous avons rebranché le second. Au bout de quelques 7 minutes, qui ont paru assez longues, je ne vous le cache pas, nous avons retrouvé progressivement notre baie en mode nominal. Le seul impact visible du coté VPlex a été la perte de deux chemins logiques, évidemment.

Quelques screenshots complémentaires, pendant la phase de “remontée” du storage controler :
ctrl2bbufail

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *