ComfyUI
ComfyUI : Le Guide Complet
ComfyUI est une solution modulaire basée sur des nœuds pour la génération par IA (images, vidéos, sons ou textes), offrant un contrôle précis sur le processus créatif.
Ce guide détaillé couvre l'installation, les concepts clés, et les techniques avancées pour optimiser vos workflows.
Découverte de ComfyUI
Concepts clés
Philosophie de conception
ComfyUI se distingue par son approche dans l’utilisation des modèles d’IA.
Contrairement aux interfaces traditionnelles qui privilégient la simplicité d'utilisation au travers d’une interface figée, ComfyUI opte pour une interface modulaire, flexible et dynamique. Cette philosophie repose sur l'idée que les utilisateurs ont besoin d'un contrôle granulaire sur chaque aspect du processus de génération par IA.
L'interface de ComfyUI est ainsi construite autour du concept de nœuds interconnectés (les fameux nodes), offrant une flexibilité sans précédent.
Chaque fonctionnalité est alors représentée par un nœud distinct, permettant aux utilisateurs de construire des workflows (flux de travail) complexes et personnalisés.
Cette approche modulaire permet une grande adaptabilité et favorise l'expérimentation créative.
Architecture basée sur les nœuds
Le cœur de ComfyUI repose sur son architecture basée sur les nœuds. Voici les composants essentiels de cette architecture :

- Nodes : Ce sont les blocs de construction fondamentaux de ComfyUI. Chaque node (nœud) représente une fonction spécifique, comme le chargement d'un modèle ou l'encodage de texte.
- Connections : Ce sont les connexions entre les nœuds, permettant le flux de données d'un nœud à l'autre. Différentes couleurs correspondent à différents type d’informations ou de données qui passent pas les connexions.
- Entrée / Sortie : Les petits points sur les nœuds qui permettent de les connecter entre-eux.
- Workflow : C'est l'ensemble des nœuds interconnectés qui forment une chaîne de traitement complète pour la génération d'images ou d’autres médias.
Interface utilisateur et contrôles
Bien que l'interface puisse sembler complexe au premier abord, ComfyUI offre des contrôles intuitifs pour la manipulation des nœuds et des workflows :
- Zoom et navigation dans l'espace de travail
- Connexion facile des nœuds par glisser-déposer
- Possibilité de réexécuter partiellement un workflow pour gagner du temps
Cette approche, bien que plus exigeante qu'une interface traditionelle, offre un niveau de contrôle et de personnalisation inégalé dans le domaine de la génération par IA.
Flexibilité et extensibilité
L'un des atouts majeurs de ComfyUI est sa grande flexibilité.
Les utilisateurs peuvent y créer des nœuds personnalisés pour étendre les fonctionnalités du système.
Cette capacité d'extension permet à la communauté de développer et partager de nouveaux outils, enrichissant constamment l'écosystème de ComfyUI.
Composants essentiels
Parmi les nœuds essentiels de ComfyUI, on trouve les diffèrents noeuds nécessaires à la génération d’image avec des modèles de diffusion comme Flux ou SDXL.

- Load Checkpoint : Ce nœud est crucial puisque c’est lui qui charge le modèle d’IA qui sera ensuite utilisé par les autres nœuds.
- CLIP Text Encode : Il convertit les textes et les prompts en embeddings, les données compréhensibles que le modèle pourra alors utiliser et traiter.
- Empty Latent Image : Ce noeud est essentiel pour la génération d’image : il crée l'espace latent initial, une représentation mathématique de l’image.
- KSampler : C'est le cœur du processus de génération d’image pendant laquelle le modèle va raffiner l'image latente pour la faire correspondre à l’embedding correspond au prompt.
- VAE (Variational Autoencoder) : Ce noeud va ensuite gérer la conversion de l'espace latent en pixels, c’est à dire en une image que nous pouvons voir.
Installation et configuration
Installer ComfyUI
L'installation de ComfyUI peut se faire de plusieurs manières, chacune ayant ses avantages et ses inconvénients. Le choix de la méthode dépendra de vos compétences techniques et de vos besoins spécifiques.
Méthode | Avantages | Inconvénients | Recommandé pour |
Stability Matrix | - Installation tout-en-un- Gestion automatique des dépendances- Interface graphique conviviale- Mises à jour simplifiées | - Moins de contrôle sur les composants individuels- Peut inclure des éléments non nécessaires | Débutants et utilisateurs cherchant une solution clé en main |
ComfyUI Desktop | - Version portable officielle- Support multilingue intégré- Gestionnaire de paquets pour extensions | - Moins flexible que l'installation manuelle- Peut être moins à jour que la version GitHub | Utilisateurs intermédiaires souhaitant une expérience "prête à l'emploi" |
Installation manuelle (GitHub) | - Contrôle total sur l'installation- Toujours la version la plus récente- Possibilité de personnalisation avancée | - Nécessite des connaissances en ligne de commande- Gestion manuelle des dépendances- Configuration plus complexe | Utilisateurs avancés et développeurs |
Procédures d’installation détaillées :
- Installer ComfyUI avec Stability Matrix (Windows, Mac et Linux)
Configuration avancée
Allocation de VRAM
L'allocation de VRAM (mémoire vidéo) est un aspect crucial pour optimiser les performances de ComfyUI. Plusieurs options sont disponibles en passant les arguments suivants au lancement :
Argument | Description | Utilisation recommandée |
--lowvram | Active un mode basse mémoire qui divise les calculs en morceaux plus petits pour économiser la VRAM. | Idéal pour les GPU avec peu de mémoire (4-8 Go) ou pour éviter les erreurs OOM (Out of Memory). |
--highvram | Utilise exclusivement la VRAM sans décharger les données inutilisées vers la RAM. | Recommandé pour les GPU avec une grande quantité de VRAM (16 Go et plus). Attention : peut ralentir les performances. |
--novram | Force l'utilisation du CPU uniquement, sans utiliser la VRAM. | Pour les systèmes sans GPU ou si vous voulez tester uniquement avec le CPU (très lent. |
--reserve-vram <valeur> | Réserve une quantité spécifique de VRAM (en Go) pour d'autres applications ou pour le système. | Utile si vous voulez éviter que ComfyUI utilise toute la VRAM disponible (exemple : --reserve-vram 1.0 pour réserver 1 Go). |
--disable-smart-memory | Désactive la gestion intelligente de la mémoire, forçant le déchargement agressif vers la RAM. | À utiliser si vous souhaitez libérer autant de VRAM que possible, mais cela peut ralentir le traitement. |
- Si vous utilisez un GPU avec moins de 8 Go de VRAM, combinez
-lowvram
avec-reserve-vram
pour éviter les erreurs OOM.
- Pour des workflows complexes ou des images haute résolution, privilégiez
-highvram
sur des GPU puissants (16 Go ou plus).
- Si vous rencontrez des ralentissements ou erreurs imprévues, testez avec
-disable-smart-memory
pour voir si cela améliore la stabilité.
Extension GPU
Pour activer les extensions GPU dans ComfyUI, plusieurs options et configurations sont possibles, en fonction de votre matériel (NVIDIA ou AMD) et de vos besoins spécifiques.
Par défaut, ComfyUI détecte automatiquement les GPU NVIDIA compatibles. Assurez-vous cependant que CUDA et cuDNN sont correctement installés sur votre système.
Pour un GPU AMD, vous aurez besoin des bibliothèques ROCm et d’une version PyTorch compatible.
Utilisation de ComfyUI
Workflows
Le workflow est le concept central de ComfyUI : il désigne un ensemble de nœuds connectés entre eux pour exécuter une action, par exemple la génération d’une image. Chaque nœud représente une fonction spécifique, et les connexions entre ces nœuds définissent le flux des données.
Créer un workflow
- Ajouter des nœuds :
- Clic droit dans l’interface pour faire apparaître le menu des nœuds
- Tapez ensuite dans la barre de recherche pour trouver le nœud voulu
- Cliquez pour sélectionner le nœud
- Connecter les nœuds :
- Faites glisser la souris de la sortie d’un nœud vers le port d’entrée d’un autre nœud
- Assurez-vous que les types de ports correspondent (mêmes couleurs)
- Les connexions incorrectes seront indiquées en rouge
- Configurer les paramètres des nœuds :
- Dans chaque noeud, ajustez les valeurs comme le modèle utilisé, les invites textuelles ou les paramètres de génération (par exemple, CFG Scale, nombre de pas).
Importer un workflow
Les workflows peuvent facilement être enregistrés, partagés et importés.
Pour enregistrer un Workflow, cliquez simplement sur le bouton Save (Enregistrer) en haut ) droite.
Pour importer un workflow, glissez-déposez directement le fichier .json sur l’interface ComfyUI ou cliquez sur le bouton Load (Charger) en haut à droite pour sélectionner le fichier.
Une fois importé, vous pouvez visualiser et modifier le workflow selon vos besoins.
Executer un Workflow
Cliquez sur Queue pour démarrer l’exécution du workflow.
Vous pouvez surveiller l’état des tâches en cours dans la section View Queue - une barre de progression (en vert) vous indique également l’avancement de l’exécution du Workflow. Le noeud en cours d’execution est également entouré en vert.