Le stockage sur Proxmox : extrêmement riche mais aussi un peu le bazar !

Bonjour à tous, vous le savez, nous avons commencé avec mon collègue Antoine (que j’espère bien arriver à convaincre de rédiger quelque chose sur ce blog un jour…) à monter notre premier cluster de production Proxmox. Une occasion pour moi d’essayer de comprendre et de vous restituer, comme je le peux, ce que j’ai compris du stockage dans Proxmox. Comme toujours dans l’open source, tout est possible, mais ne nous voilons pas la face : c’est un peu le bord, pardon…bazar. 😉

Le paradoxe Proxmox : performant et si complexe à la fois

Proxmox est une solution open source ultra-puissante, mais comme elle repose sur les fondations de Linux Debian, son écosystème de stockage forme un labyrinthe de technologies superposées, dont la plupart héritent de tout l’écosystème Linux depuis plus de 25 ans… Entre Ceph, ZFS, LVM, iSCSI et les formats de disques (RAW, QCOW2, VMDK), on a l’impression de devoir choisir entre la peste et le choléra. Et surtout, on ne s’y retrouve plus aujourd’hui lorsqu’il s’agit de choisir une solution pour une production stable et critique !

Déjà, rien que sur Linux, en plus de 30 ans, j’ai eu l’expérience de certains admins qui ont perdu des heures à configurer un stockage qui ne fonctionne pas, simplement parce qu’ils ont mélangé des technologies incompatibles ou qu’ils ne maitrisait pas l’empilement des couches sous-jacentes.

Les technologies de stockage principales sur Proxmox (et Linux !)

Je vais essayer, de la manière la plus simple possible, souvent via des tableaux, de vous présenter les technologies que je connais (j’en oublierai forcément, pardonnez-moi si c’est le cas, mais nous pouvons enrichir cela ensemble, les commentaires sont ouverts 🙂 !). Commençons par poser les bases : les couches du stockage, à l’image des couches des stacks réseau du modèle OSI.

On le vois, si au départ la gestion de disque était relativement simple, aujourd’hui elle embarque beaucoup de choses, y compris les stack réseaux (pour CEPH et iSCS) ou intègre plusieurs fonctions séparés (comme ZFS). Si on va plus loin, qu’est-ce que Proxmox offre aujourd’hui en terme de solution, sur ces empilements :

Type de stockage	Description	Remarques
CIFS	Stockage NAS	Plutôt pour du lab, simple et facile mais pas orienté performance
NFS	Stockage NAS	Plutôt des usages hybrides multi-usage ou sur des baies Entreprise NAS a fort degré de consolidation
LVM	Stockage local	Simple et performant, stockage local uniquement
LVM-Thin	Stockage local ou iSCSI	Simple et performant, qui intègre de l’allocation « on the fly »
iSCSI	Protocole réseau de communication sur TCP/IP	Le protocole de stockage sur IP standard (souvent combiné avec une couche LVM-Thin ou LVM)
CEPH	Protocol réseau Hyperconvergé
ZFS	Stockage local	Performant, puissant et réservé à des usage locaux ou DAS
ZFS over iSCSI	Stockage local ou iSCSI	Lab uniquement, ajoute la stack IP et un tunnel SSH … donc pas l’idéal pour de la perf (mais très pratique au quotidien)

J’ai omis quelques modules et filesystems spécifiques qui sont hors du scope de cet article (BTRFS, Dir mode …)

Une note importante que je viens d’apprendre, et c’est là qu’on commence à parler d’une nouvelle technologie de Proxmox, encore en preview aujourd’hui : le snapshot-as-volume-chain sur LVM. Cette option a été conçue pour apporter les snapshots et les linked clones aux stockages en mode bloc.

Concrètement, dans un scénario classique de baie SAN (iSCSI ou FC), on crée un volume logique sur un groupe de volumes (VG) classique sur ce disque (cette LUN iSCSI typiquement), puis on active l’option ad-hoc snapshot-as-volume-chain sur le backend LVM dans Proxmox. À partir de là, chaque snapshot ou clone n’est plus un simple LV figé, mais un maillon dans une chaîne de volumes (volume de base + volumes dérivés, un peu comme sur les datastores VMFS de VMware) que Proxmox gère comme une chaîne de blocs hiérarchiques. Cela ressemble aussi à ce que fait QCOW2, mais appliqué à des volumes logiques standards. L’intérêt est double : profiter du partage de blocs (LUN iSCSI) tout en conservant des fonctionnalités avancées côté hyperviseur (snapshots rapides, clones liés, consommation disque optimisée).

En revanche, on ne peut utiliser cette option qu’avec du LVM classique en mode partagé – c’est-à-dire avec plusieurs serveurs au sein d’un cluster – et non avec LVM-thin, pour une raison structurelle. LVM-thin dispose déjà de son propre moteur de thin provisioning et de snapshots au niveau du noyau, mais ses métadonnées ne sont pas cluster-aware et ne supportent pas de manière sécurisée des accès concurrents depuis plusieurs nœuds. Autrement dit, un pool thin ne peut pas être présenté simultanément à plusieurs hôtes Proxmox en écriture comme stockage partagé. Le snapshot-as-volume-chain sert justement à « compenser » l’absence de snapshots sur un LVM thick partagé ; il serait à la fois inutile et dangereux de tenter de superposer ce mécanisme à celui de LVM thin, qui reste cantonné à un usage local par nœud. Résultat : en mode partagé, Proxmox supporte LVM + volume-chain sur LUN bloc, mais pas LVM-thin, qui reste limité aux pools locaux avec ses propres snapshots intégrés.

Les format de volume disque

Enfin on monte à la couche supérieure, la VM et surtout ses nombreux types de disques virtuels :

Format de disque virtuel	Description	Remarque
qcow2	Le disque virtuel classique d’une VM Proxmox	compatible nativement avec la plupart des filesystems en mode « FILE », CIFS, NFS et consors …
zfspool/zvol	Un disque virtuel utilisant le partitionnement zfs avec les dataset ou zvol	Très performant, tire partie des fonctions avancées de zfs, mais réservé a un usage local
vmdk	Disque au format VMware, attention aux performances	Peut être une bonne option temporaire pendant une phase de migration
luks	Spécifique pour le chiffrement sur disque	A réserver à des cas d’usage spécifiques (HDS, par exemple)
rdb	Spécifique à CEPH

QCOW2 est le format habituel sur des environnements utilisant du stockage fichier en réseau de type NFS, ou en local sur du LVM classique. Ce format intègre nativement la compression et les snapshots, ce qui permet d’éviter d’avoir recours à des fonctions avancées comme l’option volume-chain, mais au prix de performances en retrait.

Notre direction aujourd’hui

L’idéal, à mon sens (même si je n’ai pas une grande expérience de production sur Proxmox), consisterait à opter pour iSCSI avec LVM et la fonctionnalité volume-chain. On accepte ainsi l’overhead lié à l’espace occupé par les snapshots en mode thick sur les volumes disques, tout en laissant la baie backend gérer sa propre réduction des données.

Dans la pratique je serais curieux d’avoir vos retours sur ce sujet du sizing moyen des volumes iSCSI provisionnées sur vos clusters et leur nombre. Avez vous des règles de calcul simple du style :

Last but not least

C’est à peu près tout pour l’instant, je découvre et lit beaucoup en ce moment, évidemment, mais à votre écoute sur vos solutions en production et celles que vous recommandez aujourd’hui, avec votre recul sur vos clusters de production !

Merci d’avance pour vos retours et suite au prochain épisode …
Allez hop hop hop … production dans moins d’un mois !

8 réponses

Philippe dit :

15/06/2026 à 9h37

Bonjour,

ZFS sur iSCSI, pourquoi utiliser un tunnel SSH ? Pendant notre phase de tests, j’ai monté un backup server en miroir ZFS sur deux de nos nas Synology, chaque NAS présentant une cible iSCSI montée directement sur le backup server virtuel, en multipath : ça fonctionnait très très bien. et cerise sur le gateau : la maintenance des NAS se faisait facilement en disant à ZFS de suspendre une des deux cibles le temps du redémarrage. le resilver était alors ensuite très rapide.

Actuellement, nous avons ~200 VMs de production sur proxmox / ceph, une fois configuré : ça juste marche.

Répondre
Cédric dit :

15/06/2026 à 9h41

Bonjour Philippe. Merci pour votre retour,
Je n’ai pas creusé le ZFS over iSCSI, juste lu des choses. Donc tu dis qu’on peut monter directement une source iSCSI et dire a Proxmox d’utiliser ce volume directement comme si le raw était local ?

Il y a des restrictions au ZFS plutot que d’utiliser le classique LVM ?

Répondre
1. Philippe dit :
  
  16/06/2026 à 12h12
  
  Bonjour,
  Oui, mon cas d’usage était le suivant : 2x NAS Syno, 2x carte 10GbE par nas avec une IP par carte, et un proxmox backup server en tests. Coté PBS, démon multipathd pour éviter de voir double ;-), et ZFS en miroir par dessus, créé en CLI. Et après, il est vu comme un volume local ZFS. Par contre, il faut gérer correctement le démarrage des différents services pour que ça ne casse pas au redémarrage.
  
  Je ne suis pas un pro de ZFS mais je ne connais pas plus de restrictions d’usage.
  
  Répondre
2. Raviere dit :
  
  16/06/2026 à 14h37
  
  pas de mode shared entre tes nodes par contre avec zfs monté sur un lun
  
  donc les seules alternatives pour un vmfs like c’est soit une baie de sto qui gère zfs (freenas …) over iscsi et là ok c’est shared entre tes noeuds et tu balades tes vm comme tu veux , soit lvm thick sur un lun avec iscsi/fc/nvme pour le protocole de transport
  
  Répondre
Raviere dit :

16/06/2026 à 13h12

ensuite comme dit philippe tu peux tout faire – même du ceph avec des disques venant de baies (bon pas pour de la prod uhuh)

les conf qu’on a avec des baies de sto (avant l’arrivé du snap sur lvm thick) c’était du glusterfs pour permettre le partage entre les nodes et montage dans un directory de l’ext4 (lun présenté en fc mais iscsi ne change rien) et du coup on gérait les snap (avec raw ou qcow2 pour les disques des vm), et effectivement depuis l’arrivé du volume chain pour permettre l’usage des snapshots, là je me pose plus la question lvm thick et volume chain et mode shared sur les nodes, qu’importe le protocole pour accéder au lun (t’a potentiellement moyen nvme /tcp également ).
Sur du ceph c’est raw pour les disques comme t’a indiqué
j’ai pas encore trouvé l’équivalent de crypter le disque d’une vm, tu parles de luks mais ça s’applique à un lvm de mémoire correct ?.

Répondre
Cédric dit :

17/06/2026 à 8h22

oui sans doute, je n’ai pas creuse luks, mais faudrait aussi.

accessoirement, on a eu avec un expert une discussion très intéressante sur le volume chain et le LVM-thick. Je reste dubitatif car il m’a soutenu qu’on pouvait, avant le système de volume chain, utiliser du qcow en mode « raw » pour utiliser les fonctions de snap … je comprends plus trop, pour moi le qcow était un format de fichier, comme le vmdk et la on me dit qu’on peut faire du qcow sur du datastore en mode raw, sans file system dernière ….
j’avoue que c’est encore un peu nébuleux avant d’avoir plusieurs avis et me faire une intime conviction …

Répondre
1. Raviere dit :
  
  17/06/2026 à 16h39
  
  du disque en raw et snapshoté oui c’était possible avant volume chain , avec pg, vg et un fs clusterisé au dessus (genre gfs2) et montage sur un /mnt/tonmountpoint sur tous les nodes , c’est ce que je pratiquais en pve 7 je confirme, et fallait avoir du dlm du lvm lockd, des scripts dans init
  
  Répondre
Thibaut BASCOULERGUE dit :

17/06/2026 à 9h29

Nous sommes en LVM-thick over ISCSI à Poitiers. Fonctionne très bien. Cela permet aussi d’avoir les snapshot as volume chain.

Répondre