En un peu plus d’un an, Stable Diffusion est devenu une référence de la génération d’image par IA.
C’est aussi le principale modèle du genre qui soit complètement partagé en Open Source - ce qui l’a rendu particulièrement populaire auprès de nombreux développeurs qui s’en sont emparé et on créer des logiciels pour mieux l’utiliser.
A la base, Stable Diffusion n’est en effet qu’un algorithme de génération d’images à partir de texte (le fameux text-to-image) qui s’exécute au travers des lignes de code d’un script ou d’un programme. Il faut donc savoir coder pour l’utiliser.
Pour rendre Stable Diffusion plus facilement utilisable, on a donc mis au point des interface qui permettent de l’utiliser et de générer des images sans devoir coder ni comprendre toutes les subtilités techniques de l’algorithme.
La plupart de ces interfaces fonctionnent dans un navigateur web comme Chrome ou Firefox. On les appelle donc des interface Web (WebUI an anglais).
Cet articles présente les principales interfaces web que vous pouvez installer sur votre ordinateur pour utiliser Stable Diffusion.
Automatic1111
Automatic1111, parfois abrégée sous le nom A1111, C’est sans aucun doute l’interface Web de Stable Diffusion la plus connue. C’est aussi l’une des plus anciennes et des plus complète.
En fait, elle est tellement populaire qu’on peut la considérer comme l’interface par défaut de Stable Diffusion - d’autant qu’elle existe pratiquement depuis les début de Stable Diffusion. C’est d’ailleurs elle qui est utilisé dans la plupart des guides, tutoriaux et vidéos sur Youtube et ailleurs (ce blog ne fait pas exception).
Cependant, elle n'est pas la plus facile à utiliser en raison d'un manque de documentation officielle et d'une liste extensive de fonctionnalités qui peut être intimidante.
Elle offre des options comme l'outpainting, l'inpainting, le color sketch, le prompt matrix, l'upscale, et l'attention, rendant l'interface très intuitive et facile à utiliser pour générer des images à partir de prompts textuels ou modifier des images existantes avec des prompts textuels.
Automatic1111 sur le Blog
Plusieurs articles et tutoriaux sont disponible sur le blog pour vous apprendre à utiliser au mieux cette interface de Stable Diffusion :
- Installer Automatic1111 sur Windows, sur Mac ou via Google Colab
- Notre manuel complet pour Automatic1111 (en français)
Fooocus
Fooocus révolutionne la génération d'images en combinant les meilleures fonctionnalités de Stable Diffusion et des designs de Midjourney.
L’interface de Fooocus élimine le besoin de réglages manuels, permettant aux utilisateurs de se concentrer uniquement sur l’écriture de prompts et la génération d'images. Cette approche minimaliste réduit la complexité associée à d'autres interfaces de Stable Diffusion, rendant Fooocus particulièrement accessible et facile à utiliser pour les débutants.
Cette simplicité n’empêche cependant pas Fooocus d’être complet et de proposer un grand nombre de fonctionnalités comme les styles automatiques, l’inpaiting, l'outpainting, l’utilisation d’image de référence en prompt,…
Fooocus sur le Blog
Fooocus est mon interface favorites et j’ai publié plusieurs guides et tutoriel pour son utilisation :
- Réparez et modifiez des images avec l’Inpaiting dans Fooocus
- Maitrisez l’Image Prompt dans Fooocus
- Découvrez la puissance des Wildcards dans Fooocus
Forge UI
Forge UI est une interface utilisateur innovante qui s'intègre parfaitement avec les modèles de génération d'images de Stable Diffusion mais aussi le plus récent Flux.
Conçus à partir d’une réécriture partielle d’Automatic1111, Forge UI offre une plateforme intuitive qui facilite l'accès à la création d'images générées par IA. Plus rapide et optimisé, Forge se profile comme le remplaçant idéal pour Automatic1111 aupès des utilisateurs désireux de bénéficiez des dernières avancées et d’utiliser de nouveaux modèles comme Flux.
Forge sur le Blog
- Apprenez comment Utiliser Flux avec Forge
- Utilisez Forge sur le Cloud avec RunDiffusion
ComfyUI
ComfyUI est une interface utilisateur basée sur des Nodes pour Stable Diffusion. D’apparence complexe, elle se distingue par sa transparence, montrant exactement ce qui se passe et d'apprendre comment fonctionne Stable Diffusion.
Elle est notamment utilisée en interne par StabilityAI, les créateurs de Stable Diffusion, pour tester les évolutions et modifications de l’IA.
Le fonctionnement en Nodes qui sont autant d’étape configurables dans la préparation et la génération d’image avec Stable Diffusion permet une approche modulaire et la création de workflows complets et personnalisés pour la génération en text-to-image ou en image-toi-image.
Comme Automatic1111, ComfyUI bénéficie d’une grande communauté d’utilisateur qui crée des extensions pour l’améliorer et étendre ses capacités - ce qui lui permet également d’intégrer rapidement les dernières techniques et modèles pour Stable Diffusion.
SD.Next
SD.Next est une interface utilisateur Web pour Stable Diffusion destinée aux utilisateurs avancés.
Elle partage la même base de code qu'Automatic1111, rendant les deux interfaces très similaires.
Cependant, SD.Next se différencie par son traitement optimisé grâce aux derniers développements de torch avec notamment le support de torch.compile.
SD.Next supporte également plusieurs modèles de diffusion alternatifs Kandinsky et DeepFloyd IF.
VoltaML
VoltaML propose une API Stable Diffusion et une interface utilisateur élégante avec un support pour l'accélération AITemplate.
Conçue pour la simplicité et la facilité d'utilisation, tout en restant riche en fonctionnalités, VoltaML se distingue par son interface utilisateur moderne et élégante. Elle offre également un manager, le Volta Manager, qui simplifie le processus d'installation, rendant encore plus facile l'utilisation de VoltaML.
Stability Matrix
Il ne s’agit pas a proprement parlé d’une interface web puisque Stability Matrix est en fait un installateur qui permet d’installer Stable Diffusion et ses interfaces. Ils permet en effet d’installer facilement les différentes interfaces présentée dans cet article tout en centralisant l’usages des fichiers et des ressources communs aux différentes interfaces.
Le gestionnaire inclus permet de gérer plusieurs environnements de manière transparente, en utilisant un seul stockage de modèle, ce qui simplifie votre flux de travail comme jamais auparavant. Il intègre également un module de connexion à CivitAI, permettant un accès sans faille aux derniers checkpoints, LoRA et autres modèles partagés sur la plateforme.
Depuis peu, Stability Matrix propose également sa propre interface simplifié, Inference, qui permet également la génération d’image.
Ecrit par