Diffus offre depuis plusieurs mois un service abordable permettant d’utiliser simplement Stable Diffusion sur le cloud avec l’interface d’Automatic1111. En hébergeant et executant Stable Diffusion sur ses serveur, Diffus élimine les barrières techniques et permet d’utiliser la génération d’image depuis n’importe quel appareil connecté à Internet, sans avoir besoin de machine puissante ni de GPU dernier cri.
Leur offre vient encore de s’étendre avec l’arrivé de Refocus, une version sur mesure de Fooocus, une interface alternative facile à prendre en main très puissante. Cette nouveauté rend la génération d’images bluffantes de qualité encore plus facile - avec tous les autres avantages du Cloud Diffus.
Utiliser Refocus
Utilisation simple
Diffus semble vouloir mettre Refocus à l’honneur et c’est donc désormais le premier tab ouvert lorsque vous accéder à l’interface.
Si elle fonctionne comme avec l’interface originale de Fooocus et dispose des mêmes fonctionnalités, Refocus dispose cependant de sa propre interface, légèrement différentes. Tout comme l’originale, cette interface se veut simple et conviviale de manière à permettre de générer des images sans se prendre la tête.
Génération à partir d’un prompt
Au départ, l’interface n’affiche donc qu’un champ unique pour décrire l’image (le prompt) et la mention “Cinematic” qui correspond à sa pré-configuration par défaut. Générer une image se fait donc tout simplement en indiquant sa description et en cliquant sur le bouton Generate - en quelques secondes, la génération démarre et vous verrez les images s’afficher.
Comme vous le voyez, vous n’avez besoin de rien de plus pour générer des images de qualité avec Refocus. Il emprunte en effet la fonctionnalité d’amélioration automatique des prompts de Fooocus, basé sur un IA de type GPT, pour ajouter des mots clefs pertinents à votre description qui améliorent la qualité du résultat.
Un des avantages de Fooocus / Refocus est qu’il n’est pas nécessaire d’écrire des prompts complexes et de connaitre plein d’astuces et de mots clefs. Comme le montre les exemples ci-dessous, une simple description de ce que vous souhaitez voir suffit pour créer des images de qualité.
Le 7 pré-configurations de Refocus
Toujours dans le but de faciliter la génération d’image et d’éviter d’avoir à maitriser les paramètres de Stable Diffusion, Refocus propos d’utiliser des Preset, ou pré-configurations.
Pour utiliser une pré-configuration, il suffit de cliquer sur celle active (Cinematic, par défaut) pour faire apparaitre la liste des pré-configuration et choisir celle que vous souhaitez utiliser.
Il y a actuellement 7 pré-configurations disponibles :
Cinematic : C’est la configuration de base de Refocus, optimisée pour générer des images à l’esthétique assez marquée, avec un éclairage de studio et un rendu proche du cinéma. Elle utilise le modèle JuggernautXL 6.
Realistic : Si les réglages par défaut ne génèrent pas des images assez réalistes à votre goût, essayez cette pré-configuration. Elle est optimisée pour un rendu photo en utilisant le modèle Realistic Stock Photo et le LoRA Film Photography Style.
Stability AI : Cette pré-configuration utilise essentiellement les paramètres conseillés par Stability AI pour l’utilisation de SDXL avec son Refiner. C’est un bon point de départ si vous souhaitez ensuite modifier vous-même des paramètres.
Anime : Cette configuration est très différentes et est prévue pour générer des images d’anime et de manga. Elle combine notamment les modèles Blue Pencil XL et Dreamshaper 8 (en refiner)
LCM : Il s’agit pratiquement de la même configuration que le mode Cinematic par défaut mais en activant la génération ultra-rapide de Fooocus qui utilise la technique LCM pour générer les images plus rapidement.
Turbo : Cette pré-configuration utilise le modèle TurboVision, basé sur SDXL Turbo, et permet elle aussi de générer des images très rapidement. Le reste des paramètres sont les mêmes qu’en Cinematic.
Lightning : Similaire au preset LCM, il utilise la même configuration que le mode Cinematic mais en y appliquant la méthode de génération ultra-rapide de SDXL-Lightning.
Paramètres de génération
En cliquant sur l’icône de paramétrage à droite sous le bouton Generate vous pouvez faire apparaître l’interface de configuration qui permet de choisir les différents paramètres de la génération d’images.
Les différents paramètres sont repartis en 4 onglets :
Settings
C’est sous cet onglet se trouvent les paramètres de base de la génération d’image :
- Performance : permet de choisir entre une génération rapide (Speed) ou plus qualitative (Quality) ainsi que d’activer la génération ultra-rapide utilisant le LCM (Extreme Speed). Lorsque vous activer la pré-configuration Turbo, un mode de performance correspond est également disponible (et selectionné)
- Aspect Ratio : Ce selecteur permet de choisir la largeur et la hauteur de votre image parmi une série de valeurs définies et optimisée pour la génération d’images avec SDXL.
- Number of image to generate : Changez cette valeur pour choisir le nombre d’image générée à partir de votre prompt à chaque fois que vous lancez une génération.
- Negative Prompt : Ici, vous pouvez indiquez en prompt négatif tout ce que vous ne souhaitez PAS voir dans votre image.
- Seed : En décochant la case “Use randome seed”, vous pouvez indiquez un seed de départ pour la génération, un numéro qui conditionne la génération (Les même paramètres avec le même prompt et le même seed donneront la même image).
Styles
Refocus vous propose une longue série de Style prédéfinis que vous pouvez choisir et qui seront appliqués à votre prompt. Tous ces styles fonctionnent en modifiant votre prompt avant de générer l’image.
Le Style Fooocus V2 est particulier car il utilise l’IA pour enrichir votre prompt avec des termes pertinent. Tous les autres correspondent à des mots clefs pré-définis qui seront ajouté en prompt ou en prompts négatif pour obtenir un résultat.
Consultez également notre bibliothèques de Styles SDXL dont la plupart sont disponibles dans Refocus.
Models
Dans cet onglet, vous pouvez choisir un modèle de base pour la génération d’image (base model). Vous pouvez également choisir et configurer un refiner et jusqu’à 5 LoRAs en même temps.
Comme Fooocus, Refocus ne permet de n’utiliser en modèle de base que les modèles basés sur SDXL, car toute la génération d’image est optimisée dans ce sens. Le Refiner, cependant, peut également être un modèle Stable Diffusion 1.5 - Comme le fait Refocus avec sa pré-configuration Anime.
Refocus étant encore en phase beta, seuls les modèles et LoRA correspondants aux 6 pré-configurations sont actuellement disponibles. Diffus prévoit cependant de rendre prochainement possible l’utilisation de sa vaste librairie de modèle (plus de 20.000).
Advanced
Sous cet onglet se trouve deux paramètres avancés que les habitués de Stable Diffusion veulent parfois pouvoir modifier : Les Guidance Scale (aussi appelée CGF Scale) et l’Image Sharpness.
Si vous n’avez aucune idée de ce à quoi servent ces paramètres, ne vous en inquiéter pas. Fooocus est fait pour que vous n’ayez pas à vous en soucier.
Génération à partir d’une image
Refocus permet également d’utiliser les fonctionnalités de génération à partir d’une image de référence de Fooocus. Cliquez sur la petit icône d’image à droite du prompt pour ouvrir l’interface d’ajout d’image source.
Refocus propose 3 méthode de génération à partir d’une image :
- Upscale or Variation permet d’agrandir une image (Upscale) ou d’en générer des variations (Vary). Pour l’utiliser il suffit de télécharger l’image dans la zone d’upload et de choisir l’option voulue.
- Image prompt est une fonctionnalité plus avancée qui utilise une image à la place ou en complément de la description textuelle du prompt. C’est aussi cette interface qui permet d’utiliser certaines fonctionnalités de contrôle de l’image finale apparentées au célèbre ControlNet de stable Diffusion.
Même si l’interface est un peu différente, vous pouvez apprendre à utiliser ces fonctionnalités dans notre tutoriel sur l’Image prompt de Fooocus puisqu’elles fonctionnent de la même manière dans Refocus.
- Inpaint or outpaint permet d’étendre une image par un ou plusieurs bord à la fois (Outpaint) ou d’en redessiner une partie (Inpaint).
Galerie d’image
Les images générées pendant votre session sont affichées directement sous l’interface de Refocus.
A chaque génération, un nouvelle ligne s’ajoute avec le prompt et les images générées. Cliquer sur une image permet de l’afficher en plus grand et le lien Generation Parameters permet de voir les paramètres utilisées par Refocus pour la génération.
Toutes les images générées avec Refocus sont également sauvegardé dans votre galerie d’image Diffus, accessible depuis l’onglet Image Gallery. Où elles apparaissent dans une galerie dédiée.
Accéder à Refocus
Refocus est accessible à tous les utilisateurs de Diffus et est donc disponible gratuitement.
Créer un compte gratuit
Pour démarrer avec Diffus et Refocus, rendez-vous sur le site web de Diffus et cliquez sur le bouton Get Started qui va ouvrir la page de login.
Là, cliquez sur le petit lien Register en bas de l’écran pour créer un compte en suivant les instructions.
Alternativement bous pouvez également vous connecter en un clic à l’aide de votre compte Google ou Github.
Dès que votre compte est créé, Diffus ouvrira l’interface web de Stable Diffusion qui s’ouvre sur Refocus et y créer vos première images.
Utilisation des crédits
Un compte gratuit sur Diffus bénéficie d’un minimum de 20 crédits par jours. En vous connectant régulièrement, vous pouvez cependant obtenir jusqu’à 50 crédits par jours.
La génération d’une image avec Refocus coute 4 crédits par image en mode normal et 2 en utilisant les pré-configuration turbo et lcm qui vont plus vite et consomment moins de ressources.
Refocus étant encore en phase beta, son utilisation bénéficie d’une remise de 25%. Une image coute donc 3 crédits en mode normal et 1,5 crédits en mode rapide (lcm ou turbo).
→ Pour tous savoir sur les crédits et les possibilités d’abonnement de Diffus, consultez notre article de présentation de Diffus.
Limitations de Refocus
Refocus est une solution intéressante et efficace pour utiliser Fooocus et Stable Diffusion sur une plateforme cloud stable et abordable.
L’intégration de Fooocus dans Diffus présente cependant quelques limitations :
- En phase beta, il n’est pas possible d’utiliser d’autres modèles ou LoRAs que ceux utilisés par les pré-configurations.
- Les images sauvegardées dans la Galerie d’images ne reprennent ni le prompt ni les paramètres de générations.
- La fonctionnalité Describe de Fooocus qui permet d’obtenir un prompt correspondant à une image n’est pas disponible dans Refocus.
- L’accès à tous les paramètres avancés de génération comme le choix du sampler, disponible dans Fooocus en activant le Developper Debug Mode, est désactivé dans Refocus.
- Il n’est pas non plus possible d’ajouter des fichiers de Wildcards ou de Styles supplémentaires à Refocus.
Malgré ces quelques limitations, Refocus reste une très bonne intégration de Fooocus dans la suite d’outils de Diffus qui y gagne une solution simple pour générer des images de hautes qualités. Cela en fait une des meilleurs options pour les débutants et les amateurs avertis qui désirent créer des imagees avec Stable Diffusion sans avoir besoin d’un ordinateur puissant ni d’apprendre à installer (et mettre à jour) les différents modèles Stable Diffusion et leurs interfaces.
Ecrit par