Nous utilisons vCenter Operations, devenu depuis un an vRealize Operations, depuis plusieurs années déjà. C’est outil vraiment intéressant pour le capacity planning et l’analyse de performance. La principale critique qu’on peut lui faire, c’est surtout, de mon point de vue, sa complexité. Certes, l’outil a beaucoup évolué depuis les deux/trois dernières années, mais dès que l’on va un peu plus loin que les grands rapports généralistes et macroscopique, nombre de métriques sont souvent obscures et leur exploitation difficile.
Pour autant, conscient cela, VMware a également beaucoup travaillé (via des sessions au VMworld, des tutoriels en ligne etc.) a rendre les indicateurs plus pertinents et moins élitistes dans leur approche. La nouvelle version 6.3 sortie récemment continue dans cette voix et apporte nombre d’améliorations sur ce point précis, mais pas que. A cette occasion, je vous propose de refaire un point global sur l’outil et les améliorations constatées depuis environ une année. Du coup, je vais également reprendre des évolutions qui ne datent pas forcément de la 6.3 mais qui ont été amenées par des versions précédentes.
La première chose à savoir sur vRealize Operations, quoi qu’on en dise, c’est qu’il vous faut un minimum de bagage technique si vous comptez l’exploiter à fond. J’en veux pour preuve les nombreux billets que j’ai pu faire sur la gestion quotidienne des performances de vos datacenters virtualisés et tout le chemin que j’ai moi-même parcouru pour arriver aujourd’hui, je pense, à enfin commencer à maîtrise le “machin” (comme dirait mon responsable ^^).
Nonobstant, il faut bien commencer par le début et force est de constater que désormais, avec vROps 6.3, VMware a opéré de nombreux ajustements pour rendre les tableaux de bord généralistes beaucoup plus lisibles et simples. Le triptyque “Health”, “Risk” et “Efficiency” restent bien présents, mais ils sont plus discrets. Quand on nous présentait initialement des tableaux avec ces trois valeurs et un pourcentage au centre de chaque “badge”, désormais, on nous propose plus qu’un code de couleur, déjà présent et une présentation plus claire des alertes. De plus, avec la 6.3, une nouvelle présentation est disponible avec un cercle de couleur présentant le ratio visuel entre les éléments en alerte et les éléments en bon état.
Depuis quelques version (à partir de la 6.1 je crois), il possible d’influer directement sur l’élément que vous consultez (une VM, un host, un datastore etc.) via un nouveau menu d’actions. Celle-ci sont déclenchées à la demande sur le vCenter de rattachement de la ressource en question. Bien pratique quand il s’agit de répondre rapidement et simplement à une contention ou un incident quelconque. De là à penser que vROps pourrait devenir un outil de gestion quotidienne, il n’y a qu’un pas, mais on y reviendra plus loin.
Concernant la section “Analyzis” qui concentre la plupart des tableaux de bords nécessaire précisément à comprendre les sources d’incidents et/ou alertes et y remédier, là aussi, au fur et à mesure des versions, vROps est arrivé à un niveau de clarté très bien venu en terme de présentation. Les sections “Workload”, “Capacity remaining” et “Stress”, notamment, présentent des dashboard particulièrement exhaustifs permettant rapidement de trouver la cause d’un dysfonctionnement quelconque.
Les tableaux macroscopiques sont, eux aussi, très clairs et simples d’accès, même pour les non spécialistes. L’interface a évoluée aussi par petite touches et l’on peut désormais, juste en passant la souris au dessus de certaines zones, obtenir des détails ou des focus spécifiques sur les éléments situés en dessous. C’est en particulier le cas pour les heatmap, qui disposent de pleins de petits raccourcis ajoutés récemment.
D’une manière plus général, vROps, comme ses prédécesseurs, est livré avec des tonnes de dashboards dont certains, relativement récents, apporte de nouveaux axes de visibilité, notamment sur les VMware Tools ou les versions d’hyperviseurs, par exemple. Dans l’ensemble, la plupart de ces tableaux de bords sont bien pensés, clair et utiles. Bien entendu, vous pouvez vous-même construire vos propres présentations ou customiser ceux par défaut. Clairement, cet aspect de vROps est, je trouve, une vraie force par rapport à d’autres solutions (j’en parlerai dans d’autres billets d’ici quelques jours/semaines).
Je n’ai ici qu’effleuré la supervision offerte par vROps, évidemment. On pourrait y passer des heures, voire des jours. Comme déjà évoqué, cela fait plusieurs années que nous utilisons vROps chez nous et nous découvrons encore des fonctions tous les jours ou presque. De plus, nous en avons désormais profité de nombreuses fois pour déceler – et corriger – certains problèmes au sein de nos infrastructures et le ROI et clairement positif aujourd’hui, même si il aura fallut du temps pour maîtriser la bête.
Pour conclure, aujourd’hui, j’estime que vROps est arrivé à un niveau maturité très élevé. Il a pour lui de proposer des niveaux de lecture différents suivant les populations au sein de vos équipes de production, depuis les tableaux de supervision globaux et très macros, jusqu’à l’analyse précise d’un paramètre spécifique d’une VM données (latence I/O, contention CPU etc.). Ses capacités de customisation sont aussi très grandes, même si la construction de dashboard reste assez complexe et parfois laborieuse. Il couvre malgré tout l’ensemble de la problématique de supervision et capacity planning d’environnements virtualisés VMware. Si on y ajoute toutes les possibilités offertes par les plugins disponibles aujourd’hui qui se comptent par dizaines, il s’agit aujourd’hui d’un produit qui fait partie des leaders de ce marché.
A contrario, vROps reste une solution relativement chère pour qui souhaite en équiper l’ensemble de sa production et, suivant les cas, les alternatives existent et méritent qu’on s’y attarde. C’est le cas, par exemple, pour Veeam One, DCscope, Turbonomic (anciennement VMturbo) et même certaines solutions Open Source comme SexiGraf, pourquoi pas, si vous souhaitez uniquement des métriques macros.
MAJ: suite à une remarque pertinente d’un de mes followers, Wander_lust, l’aspect consommation de ressources est un point important que je n’ai pour le moment pas abordé. Je vais essayer de faire le tour des solutions que j’ai dors et déjà testé et vous ferai un retour spécifique à ce sujet dès que j’aurais des données chiffrées.
Très bon article ! ;-).
(Attention : “La principale critique qu’on peut lui faire, c’est surtout, de mon point de vue, c’est sa complexité.” ;-).
Merci ! faute corrigée :)
version 6.4 dispo