Les outils de supervision et de reporting des environnements de stockage EMC sont désormais assez nombreux et nous avons en tant que client, et suivant nos moyens, l’embarras du choix. En effet, l’outil historique “Analyzer”, intégré à Unisphere a été secondé plus récemment par le désormais gratuit, pour toute nouvelle acquisition de baie, VNX Monitoring & Reporting. D’autre part, si vous souhaitez aller plus loin, il est possible d’acquérir le fameux ViPR SRM, que je trouve personnellement très lourd et peu ergonomique. Ceci étant, cet outil est capable de couvrir quasiment 100% de la problématique de supervision d’une infrastructure de production et il est logique que son accès et son exploitation soit plus complexe qu’un simple outil de reporting stockage. Enfin, si vous êtes désargenté, vous pouvez aussi opter pour une solution do-it-yourself, comme nous l’avons fait historiquement, via des outils opensource et un peu d’huile de coude (voir mon article sur la supervision vplex via cacti, par exemple).
Depuis quelques semaines, EMC propose une nouvelle approche de la supervision et du capacity planning, en s’appuyant sur le moteur vRealize Operations de VMWare. Ca s’appelle “EMC Storage Analytics” et je vous propose de découvrir cette solution et évoquer son potentiel par rapport aux autres produits.
EMC Storage Analytics (aka ESA) se présente sous la forme d’un plug-in pour vRO à installer au sein d’une instance existante. Il s’intègre donc nativement au produit de VMWare et vient rajouter un adaptateur, qu’il s’agit ensuite de configurer. Je ne détaille pas ici la procédure d’installation d’ESA, simple et totalement standardisée, mais si vous souhaitez en savoir un peu plus, vous pouvez également consulter mon article sur l’adaptateur Brocade, également disponible, que j’avais testé il y a quelques semaines.
Une fois le plug-in installé, vous avez donc à votre disposition un nouvel adaptateur EMC, à l’intérieur duquel vous devez configurer chaque baie ou chaque équipement EMC :
… Aujourd’hui, ESA supporte les produits suivants : VNX1, VNX2, VMAX, VPlex, XtremIO et VNXe.
Sachez que pour chaque équipement à ajouter, il vous faut une licence correspondante. De mon coté, j’ai tout simplement contacté EMC via le chat du support pour obtenir des licences d’évaluation de 90 jours qui m’ont été fournies très rapidement (24h).
A partir du moment où vos baies sont configurées, la collecte commence. Le mieux est de laisser à vRO le temps de récolter quelques heures de statistiques pour se faire une idée du potentiel du produit. A l’issue, on peut commencer à explorer les metrics remontés. Ces sondes diffèrent d’un équipement à l’autre évidemment, mais il y a tout de même un certain nombre d’indicateurs universels, qui sont intrinsèquement liés à vRO : les badges et les alertes. En effet, c’est le cas pour tout élément intégré à Operations, quel qu’il soit.
Pour cette review, j’ai intégré nos principaux équipements de production, à savoir : Nos deux VNX 7500, Nos deux XtremIO et notre VPlex Metro. je vous propose donc de faire le tour des principaux dashboards disponibles pour chaque baies.
XtremIO
Concernant nos AFA, les informations remontées sont particulièrement intéressantes étant donné que la supervision XtremIO fournie de base via les service consoles reste très orientée temps réel (voir mon billet à ce sujet). Voici une liste des tableaux de bord principaux que j’ai pu découvrir :
… vous noterez qu’on va même jusqu’au suivi des IOps de chaque volume provisionné ainsi que celui du niveau de dé-duplication et compression, ce qui ajoute énormément de granularité par rapport à l’interface native. bref, vis à vis d’XtremIO, ESA ajoute une vision long terme et apporte énormément de visibilité sur le comportement de la baie au quotidien.
VPlex
Du coté de VPlex, encore une fois, là où l’interface Unisphere for VPlex apportait une visibilité temps réelle, ESA y ajoute une consolidation long terme et un suivi précis et historisé de l’activité de chaque composant. Les heatmaps sont particulièrement bien pensées, même si certaines d’entre elles comme les niveaux de latence me paraissent “bizarres”. Là ou ESA remonte des latences de plus de 35 à 40 millesecondes, dans la pratique cela ne concerne effectivement que quelques LUNs spécifiques sur des disques lents et qui plus est, particulièrement sollicités. Pour le coup, j’ai l’impression que les indicateurs de latences “globaux” traduisent les pires situations et pas une situation médiane. Ce point mérite un peu plus d’investigation, je pense :
Une petite info complémentaire tout de même : j’ai donc configuré ESA il y a quelques jours. Après 48h, nous constatons que la service console d’un de nos deux clusters VPlex était inaccessible (aucun impact sur la production, heureusement). Après investigation et contact du support EMC, nous redémarrons la SC et tout rentre dans l’ordre. A l’heure où j’écris ce billet, nous n’avons pas confirmation de la root cause de cet incident, mais cela reste assez troublant, car la seule modification sur l’infrastructure VPlex réalisée durant ces derniers jours était précisément l’ajout du polling d’ESA sur cette console… d’ici à penser que c’est Storage Analytics qui a précipité le crash de la machine, il n’y a qu’un pas que je ne vais pas franchir pour le moment, en attendant le retour définitif d’EMC. A suivre.
VNX
Nous utilisons VNX Monitoring & Reporting depuis environ 1 an au sein de notre institution. Nous avions donc, pour nos VNX 7500, un bon élément de comparaison pour juger de l’apport potentiel de ESA par rapport à une autre solution déjà en place. Dans l’ensemble, on retrouve beaucoup des metrics mis en forme par VNXMR dans l’interface vRO :
D’un strict point de vue ergonomique, j’aurais tendance à préferer VNXMR car il est plus réactif et plus léger. Pour autant, la précision des mesures et la granularité disponible via ESA va encore plus loin (supervision des interfaces FC entre autres). De plus, l’accès à la supervision des LUNs est beaucoup plus simple car elles sont toujours présentées via leur nom et non via leur LUN ID (que celui qui n’a jamais pesté devant un abscons “LUN 220” me jette la première pierre :) ).
Perspectives, potentiel et conclusion
Si l’on s’en tient au parcours des dashboards ainsi qu’à l’exploration des graphiques historiques, on peut dire qu’aujourd’hui ESA n’apporte pas tant de choses que cela par rapport à une solution intégrée ou hybride concernant la supervision quotidienne des environnements stockage et virtualisation. Il est vrai qu’il est tout à fait possible d’obtenir peu ou prou les indicateurs en question d’une manière ou d’une autre. Par contre, là ou ESA apporte énormément c’est au niveau de la concentration et de l’unicité d’accès à tous ces metrics. vRO + ESA constitue un outil de supervision et de capacity planning particulièrement efficace et cohérent. En extrapolant, avec l’intégration complémentaire d’autres plug-in spécifiques à vos infrastructures réseau et/ou Fibre Channel, on obtient un outil unique de gestion et de diagnostic englobant l’ensemble de la chaine de liaison, depuis les disques/ssd physiques jusqu’au service de machine virtuelle.
Pour autant, il manque quelque chose à vRO/ESA : en l’état, la continuité d’exploration de la chaine de liaison n’est pas assurée : en effet, du coté de la virtualisation, lorsque vous explorez l’écosystème via vRO, vous partez de la VM pour arriver, potentiellement jusqu’au datastore hébergent celle-ci. Or, une fois au niveau du datastore, on pouvait espérer que le lien s’applique et qu’on puisse continuer à descendre dans les couches via ESA (LUN, VPlex, baie). Visiblement, ce n’est pas le cas :
… les deux hiérarchie stockage et virtualisation s’ignorent, alors que techniquement il y a vraiment une continuité. Difficile de dire si cette intégration complète est prévue ou pas dans une future release de ESA pour l’instant.
Vous pouvez retrouver la plaquette de présentation de EMC Storage Analytics sur le site d’EMC à cette adresse. vRealize Operation de VMWare, quant à lui est présenté ici.