IMG_3618

IBM Cloud : big blue is back ?

Petite update du billet à 23h30 : annonce de la GA de vROps for Power Systems

On les avait presque oubliés, après les grandes années 80/90 (IBM36/38, AS400, IBM Global Services etc.), où ils étaient LA référence (toujours très chère, mais référence tout de même) dans le matériel, l’intégration et le consulting. Et puis … petit à petit, IBM s’est fait plus discret, voir confidentiel, en tout cas du point de vue de l’IT de ces 10 dernières années. Il faut dire qu’avec la revente successive à Lenovo de son segment PC/Notebooks et plus tard le reste de sa division x86, big blue a perdu un peu contact avec le monde qu’on appelait encore “Open”.

Pour autant, à défaut de faire le buzz, IBM, comme souvent, a continué à se moderniser et suivre les grandes tendances du marché, notamment autour du Cloud. A tel point qu’aujourd’hui, grâce à un partenariat visiblement très fort, IBM revient sous le feu des projecteurs avec son offre IBM Cloud …

Lire la suite …

IMG_1988

Mise à jour VxRail 4.5.225 : récit d’une épopée

Rappelez-vous (voir ici), il y a 7 mois environ, nous lancions notre chantier de mise en oeuvre de notre nouveau cluster VxRail généraliste, dit “le monstre”. En l’espace d’environ 2 mois, l’ensemble de l’environnement passait en production et la migration d’un peu plus de 500 VMs pouvait commencer. A l’époque, les machines tournaient sur ESXi 6.5 patch 02 / VSAN 6.6 pour un ensemble VxRail en 4.5.152. Même si le cluster a, depuis, été parfaitement stable coté service (c’est l’essentiel), nous avons encore souffert de certains bugs de jeunesse sur la partie purement management et supervision hardware de nos serveurs PowerEdge P570F, malgré une nette amélioration depuis nos gros ennuis de fin d’année dernière (voir mes nombreux billets sur VxRail … allez, je vous laissez cliquer sur la section en haut au centre ^^).

Pour autant, le tremblement de terre provoqué par le récent bug VSAN de corruption potentielle (dont j’ai longuement parlé aussi entre fin septembre et début octobre) nous a contraint à anticiper quelque peu la mise à jour de notre VxRail pour passer de la “152” à la toute dernière version disposant du patch critique, la “225”. Je vous propose le récit de cette épopée, qui, sans trop anticiper sur mes conclusions, s’est globalement très bien déroulée, même si nous n’avions pas du tout anticipé sa durée réelle…

Lire la suite …

IMG_3160

Bug VSAN : le patch est disponible !

EDIT: Dell EMC n’a pas traîné à annonce la disponibilité prochaine de VxRail 4.5.225 qui contiendra, entre autres, le fameux patch. Merci à Noham, Didier et David pour les infos concordantes.
EDIT2 : Voici les release notes de la build 225 de VxRail, à consulter ici (pour les clients Dell EMC).

Tout le monde l’attendait impatiemment depuis quelques jours, il est là, disponible, maintenant, le fameux patch qui corrige les problèmes de corruptions VSAN dans certaines conditions particulières (voir mes deux billets à ce sujet, ici et plus récemment ici). Son détail est décrit dans le KB#58853 pour la 6.5 et dans le KB#58849 pour la 6.7. Par ailleurs, le KB “historique” KB#58715 a été complété par des informations concernant le patch en question.

Si vous êtes sur du VSAN ready node, aucune raison de ne pas préparer une maintenance spécifique ASAP. Si vous êtes sur VxRail, l’ETA a été publié auprès des clients hier soir et on devrait avoir des nouvelles, j’espère, assez rapidement. Dans l’intervalle, ouvrez un case chez Dell EMC, pourquoi pas :)

Pour rappel, le suivi live des patchs des différentes build d’ESXi : pour la 6.5 ici, pour la 6.7 ici.

IMG_2769

Point de situation sur le bug resync/extend/resync de VSAN 6.6+

EDIT du 16/10/2018 : on vient d’avoir la confirmation que les corruptions peuvent aussi survenir lors que l’on réalisé un expand sans que celui ne déclenche l’ajout d’un component.

Mon précédent billet sur le sujet faisait état d’un bug sur les dernières versions de VSAN à partir de la 6.6.0 pouvant, dans certaines conditions, mener à des corruptions de données sur certaines VMs “à risque”. L’heure est venue, je pense de faire le tour de la question après pas mal de rebondissement depuis quelques jours.

Il a été difficile d’arriver à obtenir des informations claires pendant cette période et le caractère éminemment critique de ce bug (la corruption de données étant, sans doute, le pire scénario pour un constructeur ou un éditeur de solutions de stockage quel qu’il soit) a forcément généré pas mal d’anxiété parmi les clients de VMware et Dell EMC ayant des productions sur ces versions. la récente communauté VMUG France a été particulièrement active à cette occasion et a d’ores et déjà prouvé, s’il en était encore besoin, tout son intérêt, notamment pendant ces périodes tendues.

Je vous propose donc un nouveau billet précis et donnant des informations vérifiées et confirmées par le support VMware.

Lire la suite …

IMG_3160

VSAN 6.6/6.7 : attention aux extensions de vmdk sur vos VM (maj)

EDIT5 du 27/09/2018 : J’ai créé un autre article qui fait un point de situation global.

Bonsoir à tous !

Ca fait plaisir de vous retrouver après plus de 15 jours d’absence. La cause : un début de rentrée assez dingue pour ce qui me concerne. Cela explique, sans l’excuser, le désert de news sur vBlog, alors que l’actualité est pourtant riche en ce moment (VMUGFR, retour sur les annonces du VMworld 2018 de Las Vegas, quelques REX sur des gros incidents récents sur notre prod etc. …).

Je rouvre les vannes techniquement en vous faisant part d’une alerte sur laquelle tous les admins VSAN devraient être vigilants. A l’occasion du reboot VMUG France qui s’est tenu hier matin à Paris (c’était génial, mais je vous ferai un billet spécial ce week-end), j’ai eu l’occasion d’échanger avec des éminents collègues au sujet de nos productions respectives et ils m’ont fait part d’un bug bien inquiétant rencontré depuis plusieurs semaines chez eux. Il porte sur des cas spécifiques de corruption de données sur leurs environnements Exchange tournant sur VSAN, précisément. VMware est bien entendu sollicité et en cours de qualification/caractérisation actuellement.

Oops, même si ce n’est pas une généralité (cela n’a rien de systématique), la corruption de données n’est jamais à prendre à la légère sur un support de stockage, quel qu’il soit. Voici quelques détails des conditions particulières pouvant conduire à cette extrémité.

Lire la suite …

DFC2C31C-39EA-4FAB-AFC2-3F2EE704E0B0

Le manuel du parfait plombier VSAN (maj continue)

Dernière mise à jour : 24/09/2018

Depuis que VSAN est arrivé sur nos infrastructures de production et que, par le truchement de quelques incidents, nous avons un peu progressé dans la connaissance et la maîtrise de cette technologies je vous propose de recenser les différentes infos et commandes utiles qui nous servent de plus en plus au quotidien. Je ferai évoluer ce billet spécifique au fur et à mesure de nos découvertes ! Evidemment, si vous avez des hints & tips à rajouter, n’hésitez pas non plus à me contacter directement ou a ajouter des commentaires à ce billet.

La liste des mises à jour se trouve en fin de billet. Ajoutez-le à vos favoris, au cas où !

Lire la suite …

18-05-15 15-39-17 2372

Grafana, pour les gouverner tous

Le nerf de la guerre dans toute production informatique d’envergure, c’est la supervision. Vous le savez tous, rien n’est pire que d’être aveugle quand il s’agit de suivre et d’entretenir comme il se doit tous les composants qui participent au fonctionnement général de nos systèmes d’information. A l’opposé, il serait illusoire d’imaginer qu’un seul et même outil puisse couvrir tous les besoins en la matière : certains seront plus orientés “diagnostic temps réel” (comme VMware Log Insight, SexiLog par exemple), d’autres au contraire seront plus adaptés à un suivi moyen ou long terme, avec des courbes de tendances et/ou des outils de simulation de type “What If”. Enfin, suivant la diversité des équipements et constructeurs impliqués, on va plutôt privilégier “des intégrés” (comme vRealize Operations ou Turbonomics) ou se tourner vers de l’Open Source riche en plugins et très ouvert aux évolutions.

En somme, il n’y a pas de solution miracle et pour le coup, cela me pousse régulièrement à tester de nouveaux produits, histoire de voir si par hasard, l’herbe ne serait pas plus verte ailleurs … C’est là que démarre le sujet de ce billet.

A la suite de nombreux échanges avec mon pote Erwan Quelin, que j’ai connu il y a déjà plus deux ans à l’occasion du VMworld 2016, nous avons décidé de nous rencontrer pour démarrer une collaboration autour, au départ, de la supervision des baies Unity. Il se trouve en effet qu’Erwan venait de terminer le développement de la v1 de UnityMetrics, un outil open source capable d’interroger l’API REST d’une baie et d’en récupérer les divers points de supervision et les restituer au format “Telegraf” (j’y reviendrai).

Histoire de remettre cette initiative dans le contexte, les Unity disposent aujourd’hui, certes, d’un super outil “Cloud” géré par Dell EMC, CloudIQ. Malgré tout, je trouvais intéressant de conserver des metrics en local pour le capacity planning et de disposer d’une accessibilité plus directe par nos équipes de production. Il me fallait un framework adapté pour construire cela. D’autre part, je voulais depuis longtemps me mettre à Grafana… les planètes étaient donc parfaitement alignées pour travailler sérieusement et profiter de l’expertise d’Erwan sur ce sujet.

Dont acte, décision est prise de se voir… ce n’était que le début, tout de suite, la suite !

Lire la suite …

Image 007

Easyvirt DCScope v6 en avant-première

Bonjour à tous ! Vous le savez sans doute maintenant, nos chouchous de la Nantes’tech, Easyvirt, qui, au passage, étaient présent au dernier VMug Nantes, travaillent d’arrache-pied à améliorer continuellement leur produit phare, DCScope, si bien que son cycle de mise à jour est relativement rapide avec une version majeure tous les 8/10 mois environ. Et justement, Martin et son équipe m’ont encore fait l’honneur tout récemment de tester en avant-première leur nouvelle version “v6” qui devrait arriver en GA dans les prochains jours. Pour ceux qui n’ont pas eu l’occasion de lire mes précédents billets sur cet excellent produit de monitoring et capacity planning d’environnements vSphere, rendez-vous tout de suite ici et ici) avant de lire la suite. S’t’un’ordre !

Inutile de vous rappeler tout le bien que je pense de la société et de son produit phare, évidemment. Alors, ne traînons pas : petit tour d’horizon de DCscope v6 en mode “primeure”, pour ce printemps 2018 !

Lire la suite …

IMG_2240

vSphere/VSAN 6.7 sont annoncés !

C’est le buzz de cette après-midi : la nouvelle itération vSphere et, se faisant, VSAN sont de sortie sur la toile, vCenter 6.7 et ESXi/VSAN 6.7 ! Pour l’instant, on trouve surtout des infos sur VSAN en fait, avec un article de Duncan Epping dédié à consulter d’urgence ici ainsi qu’un article sur Virtual Blocks (chez VMware), à lire ici.

Je reviendrai sur les grosse évolutions de VSAN dans un article dédié dès que j’aurai eu un peu de temps pour décortiquer tout ça, mais si je devais résumer très rapidement : interface HTML5 pour VSAN (whooo !), de grosses améliorations coté stretched clusters et des optimisations diverses coté moteur.

A l’heure ou j’écris ces lignes, pas de téléchargement à se mettre sous la dent mais ça devrait arriver bientôt. Je vous propose de mettre à jour ce billet au fur et à mesure que tout cela se met en place concrètement.

Updates live :
La home page vSphere est à jour : https://blogs.vmware.com/vsphere/launch
– Nouveau billet de blogs.vmware.com sur les évolutions du jeu d’APIs REST de vCenter 6.7, ici.
– Nouveau billet de blogs.vmware.com sur vSphere 6.7 ici !
– La documentation technique de VSAN 6.7, par le menu, ici.
– Tous les liens vSphere 6.7 : téléchargement, release notes etc. par William, évidemment ^^, ici.
– Nouveau billet de Cormac Hogan sur vSphere/VSAN 6.7 (un must-read, comme toujours), ici.
NDLR :
– Rien que ça, déjà : nouvelles fonctions dispo dans le client HTML5 : Update Manager, Content Library, vSAN, Storage Policies, Host Profiles, vDS Topology Diagram, Licensing.
– Au sujet de VSAN 6.7, en vrac : le moteur vROps pour les stats VSAN au sein de vCenter 6.7, la couche iSCSI sait discuter “en mode cluster” (RAC, MCSC etc.), support des devices gérant des blocs de 4K, Adaptive Resync etc.

IMG_2239

Alertes “ping” sur votre VSAN 6.6 : je vous demande de vous arrêter !

J’en parlais la semaine dernière avec Noham de MyVMworld.fr lors un petit échange sur Twitter : notre tout nouveau cluster VxRail en cours de mise en production nous affiche régulièrement des alertes “Warning” lors de ses tests de santé. Noham évoquait à l’époque une limitation à 200 echo-reply par seconde maximum sur les ESXi qui pourrait être la cause de ce comportement.

Entre temps, le week-end est passé et Noham a sorti, avec un timing parfait un nouveau billet sur MyVMworld.fr revenant justement sur un certain nombre de points autour VxRail. En fin de billet, il a linké un KB spécifique qui parle précisément de ce bug VSAN (comme c’est curieux ^^).

Du coup, je me suis rué dessus pour vérifier si c’était applicable à notre monstre : la suite en image et en texte !

Lire la suite …