En attendant notre mise en production NSX-T et afin d’éviter de passer en mode “Rognotudju”, j’ai décidé, l’approche de la cinquantaine aidante (je vous rassure, je n’assume pas du tout…), de prendre un peu de hauteur par rapport à nos choix stratégiques depuis 4 ans et les mettre en perspective. En effet, tout est finalement allé très vite et nous avons accumulé beaucoup d’expérience dans le fonctionnement et cycle de vie de VxRail, un de nos principaux piliers de production aujourd’hui. Que peut-on retirer de tout cela, avons-nous eu raison de nous jeter dans le tout “IP” et de capitaliser encore plus avec une nouvelle couche de virtualisation de réseau NSX-T ? Des éléments de réponse dans cet article.

L’aire du LUN tout-puissant

Rappelez-vous, il y a très longtemps, dans une galaxie SAN lointaine, très lointaine … mon enthousiasme face à la nouvelle technologie VVol (voir mes articles de 2014 ici et ) pleine de promesses. A l’époque, Nutanix commençait à percer et attirait déjà pas mal de curiosité avec son approche radicale hyperconvergée. Virtual SAN 5.5 s’appelait encore comme cela et arrivait tout juste sur les étagères de VMware.

Nous étions à ce moment entre deux cycles de renouvellement stratégique (en général d’une durée de 5 à 6 ans) : des baies de stockages différenciées en fonction du niveau de service exigé par nos applications (XtremIO en TIER1, VNX en TIER2, Isilon en TIER3) et un grand fédérateur, VPlex. Tout cela avait été pensé 3 ans plus tôt, en 2011, suite à un “schéma directeur stockage” assez long et complexe. Nous avions déjà une bonne expérience de cette production en tiering et le LUN régnait en maître absolu. Sauf que, déjà, se profilaient des difficultés : en dehors des machines virtuelles standards avec un dimensionnement disque moyen pour l’époque, nous commencions à “spécialiser” les stockages en utilisant massivement les Raw Device Mappings, dès que la volumétrie dépassait 500 Go. A la clef une meilleure visibilité de nos volumes applicatifs sur le SAN et surtout, la capacité à les déplacer facilement d’un niveau de service à un autre en fonction des besoins (accessoirement, cela évitait de littéralement remplir un vmfs avec une seule VM ^^). VVol apparaissait alors comme une option quasi parfaite pour nous, allant plus loin encore que les RDM et combinant en quelque sorte le meilleur des deux mondes.

Nutanix et VSAN explosent, Dell et EMC se marient

Mais, comme souvent, tout ne se passât pas comme prévu. VMworld 2015 fut clairement l’occasion d’un changement de cap pour moi, comme en témoigne mon billet quelques jours avant la grand-messe de VMware, ici. Le SDS était en train de tout balayer sur son passage, Nutanix faisait trembler les “legacy” avec sa nouvelle approche et VMware tentait déjà de trouver l’équation parfaite avec EMC pour damer le pion au trublion du HCI (vous vous rappelez de VSpex Blue ?). Bref, le LUN, pfff, démodé et tellement “2000’s” …

Enfin, Février 2016, le choc après des débuts difficiles, EMC et VMware annonçaient enfin ce qui allait devenir un best-seller un an plus tard : VxRail (voir mon billet ici). C’était d’autant plus important pour l’IT que quelques mois seulement après, Dell et EMC annonçaient leur fusion, avec son lot inévitable d’incertitudes et d’inquiétudes même, pour certains. De notre coté, on avait énormément travaillé avec Dell quelques années auparavant et cela avait été un partenaire particulier (… je devais la faire, désolé, il fait chaud ^^) pour nous ! Ensuite, EMC avait en quelque sorte “pris la suite” en nous accompagnant parfaitement dans nos nombreuses transformations IT… De fait, cette fusion ne me semblait pas du tout un problème, au contraire, les deux sociétés étant clairement faites pour s’entendre.

Evidemment, tout ne fut pas rose bien sur, le diable se cachant systématiquement dans les détails (le plus dur aura été la hotline de mon point de vue, et ce n’est pas encore terminé …).

On ne veut plus de RDM, Cédric !

Dans le même temps, les RDM commençaient eux-même à nous poser des soucis de souplesse alors qu’on les avaient utilisé précisément pour cela au départ : difficile de déplacer une machine d’un environnement à un autre au final, ce à quoi il fallait ajouter des soucis de sauvegarde et de restauration, une lourdeur certaine en matière de provisionning et un gestion aléatoire de la limite somme toute arbitraire de 500 Go que nous avions fixé au départ. La réponse de notre équipe de prod était claire : “PLUS SIMPLE, On créé la machine avec ses disque et paf, PowerON. Plus de RDM, un grand sac qui gère directement la QoS et la Perf tout seul, ce serait l’idéal. Plus assez de temps pour faire du sur-mesure”. Bref … le vers était dans le SAN.

La suite, plus récente, vous la connaissez sans doute : nous avons acquis un premier cluster VxRail “pour essayer” et sur un domaine de production restreint dont les utilisateurs étaient juges et parties : nous-même (voir mon billet ici).

Ensuite, nous avons transformé l’essai avec nos environnements de test/pré-production, big-data…. et enfin, en 2018, le monstre (voir ici) fut construit, avec ses airs de Skynet, quand même : notre réseau data-center allait-il tenir (oui, mais, bon, faut faire gaffe, voir ici), les performances et la simplicité annoncées seraient-elles au rendez-vous ? (clairement oui et oui). Finalement, on a mis le monstre en route …

Une production simple c’est bien, sécurisée et parée pour le “cloud régional” c’est mieux

Et nous voici au milieu de 2018, tout s’accélère au niveau des fameux “Groupements Hospitaliers de Territoires” et il faut penser vite, très vite (trop vite ?..) à comment héberger au mieux nos collègues des autres établissements de Loire-Atlantique membre du “GHT44”, sans pour autant repartir d’une page blanche, notre gros VxRail nous ayant couté beaucoup d’argent (le votre, par vos impôts au passage, merci ! on essaye d’en faire le meilleur usage, toujours), nous ne pouvions pas tout de suite ré-investir massivement dans une solution dédiée à l’hébergement. Il fallait être plus radical encore : nous étions dos au mur, le SDN était clairement la solution et nous devions y aller tôt ou tard, ne serait-ce que pour suivre l’évolution des directives de notre RSSI face aux menaces grandissantes.

NSX-T … work in progress, please wait

Alea Jacta Est : VxRail + NSX-T, avant tout le monde ou presque. Ben, oui … VMware Cloud Foundation on VxRail date de Mars 2019, hein. Je vous avoue que lorsque, fin décembre, ce scénario a été présenté à notre DSI, j’en avait fait quelques nuits blanches les jours précédents. Mais, finalement, nous y sommes (ou presque ^^ voir ici), NSX-T est en place, toutes les briques sont prêtes à relever nos défis à venir en tant que groupement hospitalier.

La prochaine étape me direz-vous ? Allez, quelques mots-clés en vrac, comme ça, en forme de teaser : Cohesity, Rubrik, IDPA, Veeam, Ansible, vRealize Automation, SDWAN qui sait … rien que ça … mais ce sera l’occasion d’autres billets à venir, ne vous inquiétez pas ^^.