Pour ceux qui ont une expérience de production critique, la perte d’un contrôleur au sein d’une baie disque est souvent le moment quelques sueurs froides, même lorsque le constructeur vous donne toute les garanties de continuité nécessaires. Ceci étant et toutes proportions gardées, dans le cadre d’un PoC digne de ce nom, nous avons procédé à une coupure d’alimentation complète sur un des deux storage controlers de la X-Brick. La où le challenge est à mon sens plus important chez XtremIO que sur d’autres équipements plus classique (VNX, CX au moins), c’est que les deux contrôleurs partagent l’ensemble de leur mémoire centrale via un bus Infiniband où se trouve la table des metadata associées aux données sur disques, ce qui donne plus de “poids” à ce type de test.
Je ne vais pas trop faire durer le suspens, tout s’est très bien passé, sans impact sur les environnements de test. Par contre, la console d’administration était assez angoissante, jugez plutôt :
Après quelques minutes de fonctionnement sur un seul contrôleur, nous avons rebranché le second. Au bout de quelques 7 minutes, qui ont paru assez longues, je ne vous le cache pas, nous avons retrouvé progressivement notre baie en mode nominal. Le seul impact visible du coté VPlex a été la perte de deux chemins logiques, évidemment.
Quelques screenshots complémentaires, pendant la phase de “remontée” du storage controler :