Supervision “long terme” des cluster VPlex

L’interface de management des clusters VPlex dispose en standard d’un outil de monitoring de l’activité des directeurs ainsi que de leur interfaces. Malgré tout, ces graphiques ne sont vraiment exploitables que pendant une phase de diagnostic temps réel ou tout du moins pendant un phase de collecte ciblée et limitée dans le temps.

Afin de pouvoir prendre de la hauteur avec ce genre d’indicateur, il est souvent nécessaire de disposer d’un outil spécifique qui va procéder à de la collecte systématique sur une longue période. Heureusement, les stations d’admin des VPlex proposent une interface standardisée SNMP, permettant de récolter ceux-ci pour les intégrer à un framework dédié.

Pour les besoins internes de notre production, nous avons choisi d’utiliser cette possibilité avec l’aide d’un outil open source qui fait autorité en la matière, Cacti. Pour ceux qui ne connaissent pas *encore* ce magnifique système de gestion de graphiques RRDTool (un autre outil incontournable quand il s’agit de collecter et consolider des données de performance diverses), je vous conseille d’aller le découvrir sur le site officiel http://www.cacti.net/.

La force principale de Cacti réside dans son interface de gestion ainsi que son système de template, qui permettent conjointement d’industrialiser facilement des process de collecte et les mettre en forme avec l’aide de RRDTool.

Dans la pratique, voici le type d’infos que l’on peut compiler et récupérer à partir des données SNMP de clusters VPlex :

  • Charge CPU des directeurs
  • IOps des ports WanCom, FrontEnd, BackEnd des directeurs
  • Débits de ces ports
  • Latence des I/O sur les ports en question

Voici des exemples de graphiques générés par Cacti à partir de ce type d’indicateur :

graph_image

 

graph_image

 

graph_image

 

graph_image

 

Evidemment, ces données collectées peuvent être analysées sur des très longues durées, pour pouvoir faire du capacity planning sereinement. Exemple, la latence des ports FrontEnd d’un directeur, sur 1 an :

graph_image

 

Ou son CPU :

graph_image

 

En résumé, la combinaison des données SNMP fournies par le VPlex et l’utilisation d’un outil comme Cacti donnent une autre dimension aux statistiques d’activité des clusters et permettent une gestion beaucoup plus raisonnée de la capacité pour anticiper les upgrades éventuels.

 

12 thoughts on “Supervision “long terme” des cluster VPlex

  1. paul says:

    Bonjour,
    Si vous avez une plateforme de supervision Nagios il est aussi possible de superviser vos VNX en plus des alertes mails du VNX.(disk,array fault,vnx cache,sp port).
    Il faut juste rajouter le pluging Check_emc_clariion.pl dans votre nagios et je check aussi la disponibilité des interfaces réseaux pour le NAS,mais là c’est un simple retour de ping.

    • Cédric Cédric says:

      Bonjour,

      Malheureusement, je n’ai pas pris le temps de faire des templates spécifiques pour VPlex, mais si vous le souhaitez, je peux vous proposer les scripts que j’ai utilisé sur Cacti pour la data queries. Cdt.

      • kryss says:

        Bonjour Cédric,

        Oui je suis preneur de ce que vous pourrez me donner, je créerais les graphs s’il le faut.

        Cordialement,

      • Yann says:

        Hello Cédric,

        Je supervise mes VPLEX avec l’API, mais je suis très intéressé par les scripts que vous avez utilisé pour créer les DQ et faire un peu de graph sous cacti.
        Pouvez-vous me les fournir s’il vous plait?

        Cdt

        Yann

      • Cédric Cédric says:

        Bonjour Yann,

        Comme déjà évoqué, nous utilisons directement le polling SNMP intégré de Cacti. Ce que je peux vous fournir éventuellement, c’est la liste des OIDs qui sont interrogées.

      • Bonjour,

        Je suis très intéressé par vos informations (DataQueries et autres) :)

        Si vous aviez la gentillesse de me les faire parvenir cela serait très sympa.

        Merci pour votre post en tout cas.

        @++

      • Olivier S. says:

        Bonjour Cédric

        Je suis également intéressé pour récupérer la liste des OIDs interrogés. Pourriez-vous me la transmettre svp?

        Par avance merci

    • Cédric Cédric says:

      Bonjour,

      Pour VPlex, nous utilisons directement le polling SNMP intégré de Cacti. Ce que je peux vous fournir éventuellement, c’est la liste des OIDs qui sont interrogées. Concernant spécifiquement le débit FC des différents ports, la source est encore une fois le SNMP de nos switchs FibreChannel.

      Cdt,
      Cédric

  2. Cédric Cédric says:

    Bonjour à tous,

    A la demande de plusieurs personnes (Olivier, Yann, Mikael), je vais préparer un petit billet dédié à la supervision Cacti de nos VPlex, avec les OID interrogés, les data queries etc.

    J’essaye de vous faire cela d’ici la fin de la semaine.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *