IMG_2130

Deux news VxRail pour le prix d’une !

Bonsoir !

Un petit billet léger en ce Vendredi soir pour vous annoncer la sortie de la nouvelle version de VxRail 4.7.000 qui apporte enfin la compatibilité vSphere 6.7 update 1 et son lot d’améliorations/corrections, notamment autour de VSAN (passage en 6.7 et interface HTML5). A cette occasion, je suis tombé via twitter sur un tout nouveau blog “Inside the Rails”, dont l’auteur, Jeremy Mill, fait partie de la BU VxRail/VxRack SDDC de Dell EMC. Il y a déjà quelques billets intéressants à se mettre sous la dent, donc à rajouter à votre agrégateur de flux RSS.

Inside the rails, à consulter ici.

Merci à Noham pour l’info !
Bonne lecture et bon week-end à toutes et à tous.

IMG_1995

Quotidien VxRail : retrouver des nodes disparus (les pauvres)

EDIT : Apparemment, ce n’est pas encore réglé en 4.5.210 , merci à Maxime (Twitter: @mhercelin) pour l’info !
EDIT2 : Je viens de recevoir une confirmation que les dernières versions (je n’ai pas le build exact) de VxRail intègrent bien la correction de ce bug, bonne nouvelle ! Par contre, il faut bien vérifier les numéros de build des iDrac aussi. Contactez la hotline Dell EMC pour le demander de faire le ménage et de mettre tout à niveau

Depuis plus de deux ans maintenant, nous investissons massivement dans VxRail, la solution hyper-convergé de Dell EMC. Il nous est arrivé pas mal de misères, surtout assez récemment avec les plateformes hardware. J’en ai d’ailleurs pas mal parlé à l’occasion de plusieurs billets sur le sujet. Heureusement, tout cela est désormais du passé ?

Du passé ? Mmmmmhh, oui… et non. Certes, l’immense majorité des soucis initiaux ont été réglés et VxRail constitue désormais un pilier de production pour nous. Fiabilité de VSAN, performances à la hauteur, réduction de données dans la bonne moyenne, les résultats sont là en terme de service. Mais, malgré tout, il reste encore des petits ennuis ponctuels, qui, s’ils ne remettent plus en cause notre choix, sont quand même pénibles. L’un d’entre eux est lié à des bugs résiduels dans l’interfaces IPMI des iDrac sur plateforme Dell PowerEdge. En effet, de manière aléatoire, certains serveurs “disparaissent” de la console VxRail et ne sont de facto plus supervisés par le manager éponyme.

Maiiiis, il y a une solution assez simple pour remédier au problème, en attendant une prochaine release plus stable de ce point de vue. La voici !

Lire la suite …

18-03-26 16-55-35 1989

“Le monstre” VxRail est en production !

Après avoir expérimenté, puis déployé sur des cas d’usage précis, nous y sommes désormais, notre “TIER2” historique, un peu plus de 600 VMs de production institutionnelle, commence à migrer vers un nouveau cluster VxRail, dit “Le monstre” chez nous. Le chantier d’installation s’est déroulé parfaitement, sans retard ni gros problèmes techniques, entre le mois de Février et la fin du mois d’Avril. Il s’agit maintenant de réaliser la montée en charge, après la signature de la “Vérification d’Aptitude”.

Retour sur une épopée VxRail dont le commencement date du mois de Janvier 2016.

Lire la suite …

img_9631

VxRail et son adolescence tourmentée, VSAN et sa trentaine triomphante

Je vous avais fait part il y a quelques temps de mon “rognotudju” au sujet d’un de nos clusters VxRail, victime d’une panne hardware qui n’en finissait pas et sur laquelle le support Dell EMC avait été franchement mauvais. Depuis, ce souci a été enfin résolu, courant Janvier 2018 (quand même, plus de 3 mois elapsed …) et tout fonctionne bien depuis, ouf.

Sauf que, entre temps, c’est un nouveau cluster flambant neuf chez nous, équipé de 6 Noeuds full-flash Dell PowerEdge, qui nous a encore réclamé une attention de tous les instants.

Petit récit à la Dallas de cette épopée…

Lire la suite …

17-12-01 15-06-55 1565

Rognotudju du Vendredi : Allo, le support VxRail ?

EDIT du 04/12/2017 à 10h25 : Quelques précisions concernant la panne et les nouveaux délais … buarh.

Hé oui… désolé pour Dell EMC, ça tombe encore sur vous, mais vous cherchez un peu par moment, aussi, hein, en même temps ! Après le joli troll du service logistique en Mars/Avril dernier, c’est désormais du coté du support VxRail que ça se passe. Le 10 Octobre dernier, nous avons eu un gros incident sur l’un de nos clusters : un des nœuds a perdu d’un coup tout ses disques VSAN. Oops ! Bon, déjà quand un comportement de ce type se produit, a priori, comme ça, à vue de nez, en mode intuition, avez la réserve nécessaire … on s’imagine que ça sent quand même pas mal le problème hardware, un fond de panier en vrac, par exemple ou carte SAS plantée. Ceci étant, le SR est ouvert et le travail de collecte et de diagnostic commence de la part de la hotline.

En terme de fonctionnement, pas d’impact majeur, grâce au FTT1 appliqué sur l’ensemble des machines virtuelles, mais assez sérieux pour que nous suivions le call de près, même si par définition, un VxRail, ça s’installe … et ça s’oublie ou presque, en théorie du moins. De plus, comme cela ne concernait que les disques du nœud, la partie Hyperviseur pur continuait à marcher. Nous avions donc un compute opérationnel mais un VSAN sur 2 pattes au lieu de trois, pas si gênant que cela vu le workload hébergé sur ce VxRail : des machines de Test/Pré-production.

Maintenant, comme vous pouvez le constater, nous sommes le 1er décembre et le noeud n’est toujours pas remplacé. Pendant ces derniers 50 jours, nous avons eu droit à des tonnes de tests sur VSAN, des bascules diverses, des reboots, sessions Webex, des visites sur site de nos chers collègues d’EMC Nantes (qui font ce qu’ils peuvent pour nous aider) et j’en passe. Aujourd’hui, le nouveau noeud de remplacement (ENFIN ! c’était si dur de le changer plus tôt en se posant un peu moins de questions métaphysiques sur l’univers et tout le reste ?) est chez nous depuis 10 jour, à la louche, mais toujours pas branché et pas de news récente… désespérant :(

Alors, bon, je veux bien être early adopter sur des workload non critiques, mais faut pas pousser le bouchon un peu trop loin Michael…

Bonne fin de Vendredi et bon week-end à tous !

EDIT : L’aventure continue ! En fait, j’avais effectivement oublié, comme me l’ont justement rappelé mes collègues de la production, que ce n’était pas le noeud seul, mais carrément tout le fond de panier qu’il fallait changer (oops !). On vient de nous annoncer qu’en plus le nouveau chassis ne sera pas disponible avant la mi-décembre. Et bien sûr, il va falloir arrêter tout le bouzin pour pouvoir réinsérer les noeuds dans le nouveau hardware… chouette !

17-11-27 11-33-44 1555

Présentation de la Tech Preview de l’admin HTML5 XtremIO

Bonjour à tous ! Je le dit assez régulièrement, mais une fois de plus, désolé de vous avoir laissé si longtemps (depuis presque un mois, inadmétable !) sans nouveaux billets à vous mettre sous le flux RSS. Il est vrai que la fin d’année est particulièrement chargée pour nous et la priorité va évidemment à notre chère institution, plutôt qu’à vagabonder sur la toile et écrire des grandes diatribes …

Mais rassurez-vous, j’ai de gros billets en préparation pour le mois de décembre ! Histoire de vous faire patienter, je vous propose une petite news tech concernant nos “bonnes vieilles” AFA XtremIO. C’est vrai que je n’en parle pas beaucoup en ce moment, d’une part, parce que le buzz n’est plus trop sur les AFA aujourd’hui (leurs heures de gloire sont passées) mais également parce que, tout simplement, it just works ! Dans les faits, nous maintenons à jour nos baies régulièrement, en suivant les target firmware de Dell EMC et elles ronronnent depuis plus de 3 ans maintenant.

Aujourd’hui, nous sommes en version 4.0.15 et hormis les corrections de bugs diverses zé variées, une des grosses nouveautés (depuis la 4.0.10), concerne l’intégration d’un portail HTML5 d’administration en remplacement de la console Java historique. Certes, il n’est encore proposé qu’en “Tech Preview”, mais il fonctionne déjà très bien. Petit tour d’horizon ensemble !

Lire la suite …

2017-06-21 15-05-15 0532

CloudIQ : supervision et capacity planning en mode SaaS pour vos baies Unity

EMC a toujours eu la bougeotte vis à vis des solutions de capacity planning et de supervision adaptée à ses diverses baies de stockage mid-range. Certains se souviendront avec nostalgie (ou pas !) du bon vieux Navisphere Analyzer puis Unisphere Analyzer, une option payante mais intégrée aux consoles de gestion des baies permettant de suivre l’activité des EMC Clariion CX ainsi que les premières générations de VNX. Ensuite, est arrivé (à partir des VNX2, mais compatible avec les VNX1) VNX Monitoring & Reporting, dont j’avais fait une review de la version 2 il y a quelques temps (voir ici).

Ensuite, nous avons eu droit avec les nouvelles générations “Unity” au décevant Unisphere Central, sensé vous permettre d’agréger les divers métrics et inventaires de vos machines Unity et VNX, sans vraiment y parvenir de manière satisfaisante à mon gout (voir ici).

Entre temps, les nombreux compétiteurs du constructeur n’ont pas chaumés évidemment et mettent en avant depuis plusieurs mois, vois plusieurs années pour certains, des outils beaucoup plus élégants et souvent tournés vers le cloud (garantie de simplicité et d’évolutivité continuelle). Il fallait qu’EMC réagisse : c’est désormais chose faite depuis la rentrée de l’année dernière grosso modo (cela avait été annoncé à l’EMC World en Mai 2016) et ça s’appelle CloudIQ (prononcez claoude aïe kiou).

Maintenant que nous disposons de 3 nouvelles baies Unity toutes neuves, je vous propose de faire un petit tour du “propriétaire” et partager avec vous mes premières réactions.

Lire la suite …

2017-03-30 11-46-01 0003 - Copie

Rognotudju du Jeudi : je me suis fait troller par EMC !

EDIT du 31/03 : nouvelle notification de livraison de 32 Kg le 4 Avril prochain … à suivre ^^
EDIT du 11/04 : nous avons reçu une des deux baies Unity 300F … aucune nouvelle de la seconde… 104 jours, keep counting

Plus de 3 mois que ne nous attendons deux nouvelles baies EMC Unity 300F (2 config de 20 To utile en flash) pour pouvoir continuer nos activités sur notre TIER2 ! Trois fois un mois, plus de 90 jours, quand les délais habituels depuis des années tournent autour de 3 à 5 semaines en général.

Avant de vous en dire plus, je tiens à préciser que, pour le coup, les équipes locales d’EMC Nantes sont parfaites et font leur possible pour obtenir des délais réalistes, sans succès jusqu’à présent. Jugez plutôt : après une commande fin décembre, nous obtenons une première échéance de sortie d’usine début Février, puis tout début Mars, puis le 5 Avril (jusqu’à la prochaine fois …), sans aucun moyen, ni pour nous, ni pour nos interlocuteurs d’EMC, d’avoir une réelle preuve de la fiabilité de ces annonces, bien évidemment.

Et ce n’était que le début, voilà que Dell EMC nous trolle maintenant …

Lire la suite …

2017-01-04 09-19-39 9821

Install VxRail, partie 4 : GO !

Enfin ! Après plusieurs mois d’attente, notre cluster VxRail est désormais dans sa configuration cible et quasi-prêt à rentrer en production. Si vous n’avez pas suivi le roman associé et que vous voulez dévorer ma longue prose, je vous conseille de lire mes précédents billets à ce sujet : ici, ici, ici, ici, ici ou encore .

Pour conclure cette première série de billets détaillant la mise en oeuvre de VxRail chez nous, je vous propose un petit résumé du projet, ses rebondissmeents, ses cascades à vous couper le souffle et, finalement, son dénouement en mode “Happy End” :)

Lire la suite …

organiser-son-temps

Encore un ETA sur VPlex concernant les secondes de rattrapage

EDIT 29/12/2016: La dernière version du script d’install “leapsec”, la v9, est disponible sur le site support d’EMC ici.

C’était déjà le cas en Juin 2015 (rappelez-vous …) et apparemment ça ne semble pas encore réglé pour VPlex : un ETA vient de sortir au sujet des secondes de rattrapage prévues lors du passage du 31 Décembre au 1er Janvier en cette fin d’année. Les distributions SUSE Linux qui servent de base aux Management Stations et Directeurs de nos chers clusters semblent encore sensibles à cette opération pourtant relativement régulière désormais.

Pour pouvoir sécuriser tout ça, EMC recommande de passer, comme la dernière fois, un petit script pour modifier les paramètres NTP de l’ensemble des composants des clusters. L’opération est comme toujours sans douleur, mais pensez quand même à le faire, juste pour être tranquille pendant le réveillon :)

Toutes les versions sont concernées jusqu’à GeoSynchrony 6.0 patch 2 (la dernière en date si je ne m’abuse).

L’ETA est disponible sur le support Dell EMC : https://support.emc.com/kb/490557.